Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В столице подвели итоги IX Всероссийской общественной премии «Ключевое слово». Награждение прошло в рамках форума «Языковая политика в Российской Федерации». Экспертный совет рассмотрел 250 заявок из 55 регионов страны, отобрав лучшие инициативы по сохранению и развитию языкового многообразия. Победители 2025 года: Лучшим ИТ-проектом признан портал «Татар галәме» — единая экосистема для обучения и
...В столице подвели итоги IX Всероссийской...
Ведущая рубрики «Русский устный», член редакционного совета портала «Грамота.ру» Юлия Сафонова рассказывает о семействе слов, заканчивающихся на «…знайка», в частности, об изобретённом А. В. Суворовым словечке «немогузнайка», прослеживет его толкование в разных словарях.
...Ведущая рубрики «Русский устный», член редакционного...
Когда защитники чистоты русского языка говорят о заимствованных словах, они чаще всего обращают внимание на англицизмы: джинсы, маркетинг, компьютер и многие другие. Кто-то может вспомнить о галлицизмах (заимствованиях из французского), грецизмах, латинизмах. Но в русском языке есть целый пласт слов финно-угорского и скандинавского происхождения, многие из которых пришли в него еще в раннем Средневековье. Что это за лексика и к каким сферам она относится?
...Когда защитники чистоты русского языка говорят о ...
...Где пересекались наши пути В России проживает...
Насколько хорошо россияне помнят героев произведений русской литературы и обстоятельства жизни их авторов? Всероссийский центр изучения общественного мнения (ВЦИОМ) представил результаты телефонного опроса и предложил их интерпретацию. Участники исследования отвечали на четыре вопроса в пределах школьной программы. Все вопросы были открытыми, в формате «устного экзамена», так что угадать правильный ответ было нельзя. Часть вопросов содержала ...
...Насколько хорошо россияне помнят героев произведений...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов обсуждают, как правильно ставить ударение в слове «дороговизна» и рассказывают, что это слово, а также его антоним — дешевизна — являются исключениями в семействе слов с суффиксом -изн-.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
В большинстве языков письменность упрощается. О том, почему китайские иероглифы мало изменились за тысячелетия, рассказывает статья в издании Naked Science.
...В большинстве языков письменность упрощается. О том...
...Китайские иероглифы развились из рисунков-пиктограмм...
4 апреля в пресс-центре ТАСС состоялась пресс-конференция, посвященная созданию государственной информационной системы «Национальный словарный фонд». Это электронная информационная система с открытым доступом, имеющая разные модули, которая позволяет получить информацию как о текущем словарном составе русского языка, так и о его истории на протяжении почти трехсот лет. Минобрнауки выступает оператором и разработчиком проекта, работы над ним ведутся ...
...4 апреля в пресс-центре ТАСС состоялась пресс-конференция...