Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...В таком случае языковой модели ставят задачу:...
...В случае синтетических данных должны ли мы указывать...
Наш портал учредил премию «За творческое отношение к русскому языку и любовь к детям» для авторов наиболее доступных и интересных учебных пособий по русскому языку. Первым лауреатом стала Татьяна Рик — автор серии «Веселые учебники по русскому языку». Вручение премии состоялось 20 марта 2001 года в Библиотеке иностранной литературы им. М. И. Рудомино. Учебники Татьяны популярны в большинстве регионов России, в государствах бывшего СССР, в Европе — Германии, Англии, Франции, где по ним учатся студенты-слависты, — и, как говорят, даже в ЮАР.
...Наш портал учредил премию «За творческое отношение...
...Ни в коем случае я не собиралась тягаться с общепринятым...
Этот словарь, составленный доктором филологических наук, специалистом по разговорной речи и просторечию Василием Химиком, демонстрирует актуальный и продуктивный способ русского словообразования — универбацию (от лат. unus ‘один’ и verbum ‘слово’), когда именная группа из двух слов заменяется одним словом.
...Этот словарь, составленный доктором филологических...
...В этом случае они совпадают по форме, но имеют...
Генеративные нейросетевые модели уже используются в научных текстах, и это не новость. Но насколько активно ученые прибегают к таким инструментам — хотя бы на уровне создания аннотаций к своим статьям? Группа ученых из Германии и США проанализировала более 15 млн англоязычных аннотаций биомедицинских статей из базы PubMed с 2010 по 2024 год. Их интересовали статистически измеримые перемены в
...В данном случае исследуются не автомобили, а слова...
В список нынешнего года вошли существительные лимб, проявленность, зумер, ред-флаг, сигма, имба, выгорание, промпт, слоп, брейнрот, а также междометие пупупу и глагол подсветить. Лингвисты рассмотрели более 500 слов, из которых 63 соответствовали основным критериям: недавнее появление в языке или развитие нового значения в последние несколько лет; заметный рост упоминаемости в социальных сетях, в онлайн-СМИ и на интернет-страницах в 2025 году, а ...
...Система СКАН в этом случае дает возможность проследить...
Новые междометия появляются в языке гораздо реже, чем существительные и даже глаголы. И вообще в нашем языке их не так уж много. Как появилось новое выразительное слово пупупу и что именно оно выражает?
...Новые междометия появляются в языке гораздо реже...
...и заполненной — в последнем случае...
Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
... Исследователи предполагают, что дело случае...
Все мы, носители русского языка, тем или иным образом ощущаем изменения в языке. Но далеко не все могут уловить сущность этих изменений — для этого нужен профессиональный навык, профессиональный взгляд. И тогда начинают описывать порчу языка.
...Все мы, носители русского языка, тем или иным образом...
...этикетная функция если не уходит совсем, то во всяком случае...
Орфографический словарь «Академос» Института русского языка имени В. В. Виноградова РАН подвел итоги года: за 2025-й в него добавили 921 новую словарную статью. Это значит, что сотни слов, которые мы используем каждый день, наконец получили официальную орфографическую кодификацию. Среди декабрьских пополнений — 264 статьи, отражающие самые разные пласты современной лексики. В подборку актуальной лексики попали такие слова, как ...
...названия Струго-Красненский район (хотя в общем случае...
Круглый стол, организованный Федеральным институтом родных языков народов РФ, прошел 4 апреля в ЦВК «Экспоцентр» и на онлайн-платформе «ММСО.Коннект». В нем участвовала Мария Лебедева — заведующая лабораторией когнитивных и лингвистических исследований Института Пушкина, а также руководитель образовательного направления Грамоты. Она рассказала о преимуществах билингвизма и о том, как можно ...
...формировать компетенции на русском языке, но ни в коем случае...