Подсказки для поиска

Нейросети научатся применять сложные правила русского языка

Современные программы, которые генерируют тексты, научились писать довольно складно. Однако они часто спотыкаются именно на сложных правилах русского языка, поскольку в материалах, на которых их обучают, примеров применения таких правил крайне мало.

Исследователи из МГУ и «Яндекса» разработали специальный учебный материал, призванный помочь программам лучше понимать и применять правила орфографии и пунктуации. Речь идет о самых трудных случаях, которые проверяют на ЕГЭ и олимпиадах.

База данных под названием LORuGEC включает тысячу примеров текстов с типичными ошибками и исправленными вариантами. В этой коллекции представлены 48 правил русского языка — от постановки запятых в сложноподчиненных предложениях до слитного или раздельного написания частицы не. Каждый пример не только показывает, как правильно, но и объясняет, какое правило применяется в конкретном случае.

Когда программа видит текст с ошибкой, она сначала ищет в базе похожие случаи, а уже потом исправляет. Например, если пропущена запятая перед союзом «что», программа будет ориентироваться на пример с такой же ошибкой, а не на любой другой случай неправильной пунктуации. Благодаря этому программа исправляет только то, что действительно неверно.

«Яндекс» проверил новый метод на своих больших языковых моделях YandexGPT 5 Lite и YandexGPT 5 Pro, а также на зарубежных аналогах. Точность исправления ошибок в сложных случаях выросла на 5–10%. Самая продвинутая версия программы теперь верно исправляет ошибки в 83% случаев, более простая — в 71%.

База данных и метод обучения выложены в открытый доступ, чтобы любой разработчик или исследователь мог их использовать бесплатно. Особенно полезными они могут оказаться для создания образовательных программ и приложений, которые помогают школьникам и студентам изучать русский язык.

Проект был представлен на международной конференции по компьютерной лингвистике ACL 2025 и получил приз за лучшую разработку на воркшопе, посвященном использованию ИИ в образовании. О достижениях также рассказали на Конгрессе молодых ученых, который проходит в эти дни в Научно-технологическом университете «Сириус».

Портал «Грамота.ру»

Еще на эту тему

Яндекс привлекает школьных учителей литературы для обучения «Алисы»

Их участие сделает ИИ-помощника более полезным для образовательного процесса

Проверка грамотности — один из самых частых запросов школьников к нейросетям

Это следует из опроса, проведенного российской компанией MAXIMUM Education

Нейросети проиграли людям при поиске грамматических ошибок

Это открытие ставит под сомнение языковые компетенции моделей

все публикации

Фекла Толстая: «Язык становится разнообразнее»

Как меняется русский язык? Наши друзья и партнеры рассказывают о главных трендах

«Вы» с прописной буквы — правило устарело?

За подчеркнутой вежливостью может скрываться пассивная агрессия

Слово как оружие: фэнтези о тайной библиотеке и волшебной печатной машинке

В издательстве «МИФ» вышел перевод книги Карстена Хенна «Золотая печатная машинка»

Проявленность: следующий шаг после «быть собой»

В языке поп-психологии у осознанности появилась пара

«Академос» — орфографический ресурс, а не словарь новых слов

Сотрудники Института русского языка имени В. В. Виноградова рассказали о задачах онлайн-ресурса

Сигма: независимый одиночка

Как песня в исполнении двух юных девушек прославила новый тип мужчины

Лингвист Игорь Мельчук вспоминает о жизни и науке середины XX века

Ведущие подкаста «Глагольная группа» анонсировали серию разговоров со знаменитым ученым

Слоп: низкокачественный ИИ-контент

Когда нейросети засоряют интернет-пространство бессмысленными «помоями»

Федор Успенский: «Меня раздражает, когда привычные вещи, на которых я вырос, начинают меняться»

Как меняется русский язык? Лингвисты по просьбе Грамоты рассказывают о главных трендах

Ред-флаг: предупреждение об опасности

Тревожные звоночки еще можно игнорировать, а от красных флагов лучше сразу бежать

Пупупу: новое междометие

Реакция на негатив, задумчивость и принятие неизбежного

Промпт: запрос к языковой модели

С новыми технологиями в нашем активном лексиконе появляются и новые слова

Топонимические легенды предлагают яркие истории вместо этимологии

Откуда куропатки на гербе Курска и кто стрелял из лука в Великих Луках?

Подсветить: смысловое выделение

Модный глагол позволяет расставлять нужные акценты и влиять на восприятие информации

Лимб: зависнуть в неопределенности

Слово с богословскими корнями стало обозначать подвешенное состояние

Русские отчества: как вас по батюшке?

Исторически Иванов и Иванович — одно и то же

Выгорание: остался только пепел

Как редкое слово с техническим смыслом стало популярным обозначением последствий стресса

Галина Кустова: «Есть участки, где грамматика развивается быстро и даже стремительно!»

Как меняется русский язык? Лингвисты по просьбе Грамоты рассказывают о главных трендах

Имба: крутизна, которой нет равных

Как жалоба на дисбаланс превратилась в похвалу

Зумер: непонятная молодежь

Слово, которое полюбили социологи, маркетологи и рекрутеры

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!