Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Проблема различения языка и диалекта не перестает быть актуальной для взаимоотношений разных народов и стран. От лингвистов требуют предъявить строгие научные критерии разграничения этих понятий, но в действительности едва ли не большую роль играют экстралингвистические факторы.
...Проблема различения языка и диалекта не перестает быть...
...Задача с двумя неизвестными Представим, что есть два...
Новое золото, белая изба и треугольные конверты — все эти реалии остались в прошлом, поэтому смысл многих строк не только у Лескова или Грибоедова, но даже у Высоцкого может быть непонятен современному читателю. Некоторые отгадки предлагает статья в журнале «Наука и жизнь».
...Новое золото, белая изба и треугольные конверты &mdash...
...Со временем значение многих слов меняется, что может...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
...1. Новое в русской лексике База данных снабжена...
Словарный запас — ключевое условие успешной учебы, а потом и карьеры. Но чтобы его расширять, необходимы совместные усилия семьи и школы, а у родителей не всегда хватает времени и идей, чтобы систематически заниматься с ребенком. Британские исследователи проанализировали результаты опроса родителей и учителей и предложили свои рекомендации.
...Словарный запас — ключевое условие успешной...
...Зачем пополнять словарный запас Дети постоянно узнают...
Недавно группа депутатов Госдумы внесла законопроект, согласно которому вывески, тексты в рекламе, названия товаров, районов и жилых комплексов должны быть написаны на русском языке. Исследовательский центр рекрутингового портала Superjob.ru провел опрос, чтобы узнать, поддерживают ли граждане такую инициативу. 53% участников опроса поддержали идею законопроекта. Они приводили следующие аргументы: «Надо беречь русский язык»; «В нашей стране должно быть все понятно для ...
...Недавно группа депутатов Госдумы внесла законопроект...
В последнее время устаревшая церковнославянская и конфессиональная лексика активно используются современными массмедиа. Рассчитанные на массового читателя и слушателя, современные массово-коммуникативные тексты, воспроизводя стандартные языковые модели, обращаются к устаревшей лексике для большей эмоциональности, экспрессивности.
...В последнее время устаревшая церковнославянская и конфессиональная...
...Исследователь проблем современного русского языка Е...
Русский драматург Александр Николаевич Островский был большим любителем народного слова и с интересом собирал незнакомые ему слова и выражения. Результатом его наблюдений за живой речью стали «Материалы для словаря русского народного языка». В 1993 году вышел основанный на этих материалах «Словарь к пьесам А. Н. Островского», который содержит историко-бытовой, историко-театральный и филологический комментарии. Борис Самойлович Шварцкопф подробно описал этот словарь нового типа в 1973 году, за двадцать лет до того, как он был опубликован.
...Русский драматург Александр Николаевич Островский был...
...В научной библиотеке Всероссийского театрального общества...