Подсказки для поиска

Нейросети научатся применять сложные правила русского языка

Современные программы, которые генерируют тексты, научились писать довольно складно. Однако они часто спотыкаются именно на сложных правилах русского языка, поскольку в материалах, на которых их обучают, примеров применения таких правил крайне мало.

Исследователи из МГУ и «Яндекса» разработали специальный учебный материал, призванный помочь программам лучше понимать и применять правила орфографии и пунктуации. Речь идет о самых трудных случаях, которые проверяют на ЕГЭ и олимпиадах.

База данных под названием LORuGEC включает тысячу примеров текстов с типичными ошибками и исправленными вариантами. В этой коллекции представлены 48 правил русского языка — от постановки запятых в сложноподчиненных предложениях до слитного или раздельного написания частицы не. Каждый пример не только показывает, как правильно, но и объясняет, какое правило применяется в конкретном случае.

Когда программа видит текст с ошибкой, она сначала ищет в базе похожие случаи, а уже потом исправляет. Например, если пропущена запятая перед союзом «что», программа будет ориентироваться на пример с такой же ошибкой, а не на любой другой случай неправильной пунктуации. Благодаря этому программа исправляет только то, что действительно неверно.

«Яндекс» проверил новый метод на своих больших языковых моделях YandexGPT 5 Lite и YandexGPT 5 Pro, а также на зарубежных аналогах. Точность исправления ошибок в сложных случаях выросла на 5–10%. Самая продвинутая версия программы теперь верно исправляет ошибки в 83% случаев, более простая — в 71%.

База данных и метод обучения выложены в открытый доступ, чтобы любой разработчик или исследователь мог их использовать бесплатно. Особенно полезными они могут оказаться для создания образовательных программ и приложений, которые помогают школьникам и студентам изучать русский язык.

Проект был представлен на международной конференции по компьютерной лингвистике ACL 2025 и получил приз за лучшую разработку на воркшопе, посвященном использованию ИИ в образовании. О достижениях также рассказали на Конгрессе молодых ученых, который проходит в эти дни в Научно-технологическом университете «Сириус».

Портал «Грамота.ру»

Еще на эту тему

Яндекс привлекает школьных учителей литературы для обучения «Алисы»

Их участие сделает ИИ-помощника более полезным для образовательного процесса

Проверка грамотности — один из самых частых запросов школьников к нейросетям

Это следует из опроса, проведенного российской компанией MAXIMUM Education

Нейросети проиграли людям при поиске грамматических ошибок

Это открытие ставит под сомнение языковые компетенции моделей

все публикации

От копирайта до копилефта: как менялось авторское право на тексты

Почему «Гамлет» при жизни Шекспира принадлежал театральной труппе и чем важен спор вокруг Микки Мауса

Модные слова добавляют ярких красок в палитру общения

Ими хочется щеголять, но лучше делать это аккуратно, считают гости программы «Наблюдатель»

Возможно ли дешифровать письменность острова Пасхи?

Лингвист Евгения Коровина о тайне дощечек ронго-ронго

«Это роли не играет»: какие устойчивые словосочетания мы используем в речи

В программе «Наблюдатель» лингвисты рассказали о фразеологизмах из разных языков и культур 

Названия стран и народов: реальность меняется, а языковая норма остается?

Бирма стала Мьянмой, но нас больше волнуют Беларусь и Кыргызстан

В Метасловаре Грамоты есть возможность проверять ударения при подготовке к ЕГЭ по русскому языку

Все слова, вошедшие в орфоэпический словник, отмечены специальной плашкой

Учитель Сергей Валюгин: «Грамотный язык сближается с искусством»

О речи школьников, понимании Пушкина и о том, как владение языком становится новой ценностью

Семантические сдвиги: почему слова меняют смысл

Новые значения возникают не только в соответствии с языковыми законами, но и в результате ошибок

Пять мифов о том, как устроены естественные языки

Владимир Плунгян отделяет распространенные заблуждения от данных лингвистической науки

Должен ли извиняться этичный ИИ?

Лингвист Валерий Шульгинов готов прощать ботов только на определенных условиях

«Моя мама — копия ее мама»: что случилось с падежом

Лингвист Ирина Левонтина о причудах не генетики, но грамматики

Как используется слово «фидбэк» в современном русском языке

Вышел второй номер журнала «Русская речь» за 2026 год

Школьный жаргон XIX века: бонсюжешки ушли, а ерунда осталась

Про гимназическое прошлое многих слов мы даже не догадываемся

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!