Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
В СССР активно боролись за права женщин, но при этом названия многих профессий в русском языке чаще всего употребляются в мужском роде. Как передовые идеи равенства полов вписались в российский патриархальный контекст? И почему женщины обычно предпочитают, чтобы их называли врачами и медиками, а не врачихами и медичками?
...В СССР активно боролись за права женщин, но при этом...
...Тема русских феминитивов обширна и остроактуальна;...
Откуда в русских словах беглые гласные и как это явление связано с падением редуцированных в древнерусском языке? Объясняет преподаватель Алексей Лебедев в журнале «Наука и жизнь».
...Откуда в русских словах беглые гласные и ...
...Слова сон и слон очень похожи: они оба мужского...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...В середине сентября Робин Спир, создательница проекта...
За четыре года общая сумма штрафов за нарушение закона составила более 4,5 млн рублей. Редакции и учредители СМИ получили 18 письменных предупреждений за распространение материалов, содержащих нецензурную брань. Кроме того, сайты СМИ получили более восьми тысяч обращений от Роскомнадзора в связи с бранью в комментариях к материалам, на которые также распространяется закон. Запрет на сквернословие в средствах массовой информации был установлен в
...За четыре года общая сумма штрафов за нарушение закона...
Традиционная олимпиада по лингвистике (она же Московская олимпиада школьников по лингвистике) — это крупное интеллектуальное состязание, которое открывает дорогу в большую науку молодым талантам. В этом году она пройдет в 56-й раз. Олимпиада открыта для учащихся 8–11 классов независимо от их места проживания, а также допускает участие школьников седьмых и даже более младших классов (по заданиям для восьмых классов). В задачах ...
...Традиционная олимпиада по лингвистике (она ...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Грамота: Все, кто работает с языком как исследователи...
Что такое языковая норма? Почему нам важно говорить правильно? Как понять, когда следует твердо стоять на страже старой нормы, а когда уже можно «допустить» новый вариант произношения слова? На эти и другие вопросы Грамоты ответил кандидат филологических наук, доцент кафедры стилистики русского языка факультета журналистики МГУ и лауреат Ломоносовской премии за педагогическую деятельность Михаил Штудинер.
...Что такое языковая норма? Почему нам важно говорить...
...Как у вас возникла идея создать «Словарь трудностей...
Стартап Metamentor, основанный студентами МФТИ, создал систему обработки рукописей на базе генеративного искусственного интеллекта. Система уже несколько месяцев тестируется в издательстве «Эксмо». «Алгоритмы анализируют синтаксическую сложность каждого произведения, разнообразие лексики, распознают фрагменты текста, требующие корректировки, исключения или добавления возрастной маркировки в соответствии с действующим законодательством ...
...Стартап Metamentor, основанный студентами МФТИ...
Один из проектов обновленной Грамоты — Лексикон. В него попадают новые слова, которые уже вызывают живой интерес у наших пользователей (и не только), но еще не фиксируются академическими словарями. Как выбирать и описывать такие слова — вопрос, который сегодня актуален для портала. Эксперты и сотрудники Грамоты постарались ответить на него в режиме живой дискуссии. Предлагаем вам познакомиться с высказанными идеями.
...Один из проектов обновленной Грамоты — Лексикон...
...Зачем нужен Лексикон? Рабочий термин «Лексикон...