Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Доктор филологических наук, академик Российской академии наук Юрий Дереникович Апресян скончался 12 мая, сообщается на сайте Института русского языка им. В. В. Виноградова РАН. Ему было 94 года. Гражданская панихида состоится в четверг, 16 мая, в 14.00 в ИРЯ РАН (ул. Волхонка, д. 18/2). Юрий Апресян родился 2 февраля 1930 года в Москве. Он окончил Первый московский государственный педагогический институт иностранных языков. Автор трудов в
...Доктор филологических наук, академик Российской академии...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...
Круглый стол, организованный Федеральным институтом родных языков народов РФ, прошел 4 апреля в ЦВК «Экспоцентр» и на онлайн-платформе «ММСО.Коннект». В нем участвовала Мария Лебедева — заведующая лабораторией когнитивных и лингвистических исследований Института Пушкина, а также руководитель образовательного направления Грамоты. Она рассказала о преимуществах билингвизма и о том, как можно ...
...Круглый стол, организованный Федеральным институтом...
До сих пор не теряют популярности псевдолингвистические теории искателей «славянских рун» и тайных смыслов в русских буквах. Филолог и преподаватель Светлана Гурьянова, автор книги «В начале было кофе» и блога «Восстание редуцированных», прочитала лекцию о том, как на самом деле славяне получили письменность, и показала на примерах, в чем ошибались лингвисты-любители.
...До сих пор не теряют популярности псевдолингвистические...
...Если ввести в интернете запрос «древняя...
Друзья! В день рождения «Грамоты.ру» (14 ноября порталу исполнилось 22 года) делимся с вами радостной новостью: вышел в свет «Объяснительный орфографический словарь (1–4 классы)». Его авторами стали старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, заместитель главного редактора портала «Грамота.ру» кандидат филологических наук Е. В. Арутюнова и научный сотрудник Института русского языка им. В. В. Виноградова ...
... Друзья! В день рождения «Грамоты.ру...
В новом номере среди прочих тем обсуждаются написание и функционирование заимствованного слова «фреш», история формирования русской научной терминологии в XVII веке и происхождение частицы «бишь».
...В новом номере среди прочих тем обсуждаются написание...
...Портрет слова В современных публицистических...
Давно уже замечено, что порой слово, заимствованное из того или иного языка, со временем меняет свое произношение и написание. Процесс этот вполне закономерен и обусловлен освоением заимствования, подчинением его нормам русского языка, в том числе нормам орфоэпическим и орфографическим.
...Давно уже замечено, что порой слово, заимствованное...
...Так, например, слово офис, заимствованное русским языком...
Благодаря появлению цифровых устройств мы можем читать больше, а доступ к информации у нас есть почти всегда. Но как это влияет на то, насколько хорошо мы понимаем прочитанное? Исследователи из Университета Валенсии (Испания) провели метаанализ (сравнительный обзор) более двух десятков исследований, опубликованных в период с 2000 по 2022 год, в которых приняли участие почти 470 тысяч человек. Во всех работах, вошедших в выборку, их авторы оценивали, насколько хорошо участники понимали ...
...Благодаря появлению цифровых устройств мы можем читать...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...