Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Предлагаем вниманию читателей портала статью Александра Реформатского, опубликованную в журнале «Русский язык в школе» (№ 1, 1937). Из этой статьи читатель узнает, как в первые десятилетия советской власти шла работа по подготовке общеобязательного свода правил русского правописания, который, напомним, был официально утвержден только в 1956 году, почти через двадцать лет после написания статьи (работа по упорядочению правописания прервалась в годы Великой Отечественной войны).
...Предлагаем вниманию читателей портала статью Александра...
...Предисловие «Грамоты.ру» Александр Александрович...
Сборник работ Виктора Петровича Григорьева «Будетлянин» посвящен творчеству русского поэта Велимира (Виктора Владимировича) Хлебникова. Грамота публикует одну из статей, вошедших в этот сборник.
...Сборник работ Виктора Петровича Григорьева «...
...Веха — один из псевдонимов Хлебникова....
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...Новый идеографический словарь должен стать дополнением...
В разных контекстах Вильгельм фон Гумбольдт подчеркивал различные аспекты языка. Отсюда — его разные определения. В контексте же настоящей статьи для нас имеют главное значение два гумбольдтовских понимания языка — деятельностно-речевое («Язык есть деятельность») и системно-знаковое («Язык есть система знаков»). Из первого из них вытекает возможность проследить, в каком соотношении в учении Гумбольдта находятся семасиологизм и ономасиологизм, а из второго — в каком соотношении в нем представлены язык и речь.
...В разных контекстах Вильгельм фон Гумбольдт подчеркивал...
...В отличие от Фердинанда де Соссюра (1857&ndash...
Команда ученых из Италии, США и Швейцарии проверила, насколько хорошо большим языковым моделям удается убеждать собеседников в своей правоте. Авторы привлекли к участию 900 жителей США. Каждому из них случайным образом выдали собеседника (это мог быть другой участник или чат GPT-4), тему и задачу — защищать или оспаривать предложенный тезис. Также в одном из вариантов участнику (человеку или чат-боту) была заранее доступна информация о
...Команда ученых из Италии, США и Швейцарии проверила...
Устный перевод с турецкого сложен тем, что глагол стоит в конце фразы, поэтому синхронный перевод превращается, по сути, в очень быстрый последовательный. А что самое увлекательное в работе с письменными текстами? Мы спросили у тюрколога, переводчика, доктора филологических наук Аполлинарии Аврутиной, с какими самыми большими вызовами она сталкивалась при переводе художественной литературы. И услышали две яркие и поучительные истории.
...Устный перевод с турецкого сложен тем, что глагол...
...Работа, которой я горжусь до сих пор, —...
В последние годы в России идет интенсивный поиск национальной идеи. Количество предлагаемых вариантов огромно — от «вливания» в Европу и евразийства до пития водки или пива. При всем обилии идей ни одна не становится пока доминирующей. В чем здесь дело?
...В последние годы в России идет интенсивный поиск национальной...
...Прежде всего не в самих идеях (большинство из которых...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Кто бы ни брался за создание «расширительного» словаря того или иного типа, все непременно приходили к Далю — к этому великому человеку-словарю. Подавляющее большинство людей связывает имя Даля со знаменитым четырехтомником. Все остальное, что сделал, написал, пережил Владимир Иванович, заслонено его «Словарем».
...Кто бы ни брался за создание «расширительного...
...Весть из Вермонта В конце 1989 года в «Литературной...