Подсказки для поиска

Понимают ли языковые модели игру слов?

Может ли искусственный интеллект оценить иронию в заголовке «Код накликал» или расшифровать отсылку в фразе «Особо бумажные персоны»? Задача непростая: например, чтобы понять, как устроен заголовок «Миссия сократима», нужно опознать скрытое в нем название фильма и учесть разные значения слова миссия. Чувствительность языковых моделей к каламбурам проверила международная команда лингвистов и экспертов по данным с участием специалистов факультета компьютерных наук НИУ ВШЭ.

Исследователи использовали специально сформированный масштабный корпус русских новостных заголовков с игрой слов — KoWit-24. В него вошли 2700 примеров из реальных СМИ за последние три года. Эксперимент проводили на пяти популярных моделях: GPT-4o, YandexGPT 4, GigaChat Lite, GigaChat Max и Mistral NeMo.

Перед моделями поставили две задачи: определить, есть ли в заголовке игра слов, и назвать исходную идиому или культурную отсылку.

Результаты оказались неоднозначными: обнаружить сам факт игры слов нейросетям оказалось проще, чем объяснить, в чем она заключаются. Модели часто «плавают», когда нужно восстановить фразу, ставшую основой для шутки. Самой «сообразительной» оказалась модель GPT-4o. Она показала наилучшую точность.

Также выяснилось, что контекст существенно влияет на успех. Нейросетям (как и людям) гораздо легче понять шутку, если дать им не только заголовок, но и «подводку» к новости. Если в промпте (запросе) подробно объяснить нейросети, что такое игра слов, и привести примеры, точность распознавания у большинства моделей растет.

Авторы отдельно отметили ключевую роль датасета. «KoWit-24 превращает подборку примеров в полноценный „тестовый стенд“ для ИИ. Теперь можно объективно оценивать, видит ли модель „якорь“ — ключевое слово, где происходит смысловой сдвиг», — отмечает Павел Браславский, доцент ФКН НИУ ВШЭ.

До сих пор модели обучались в основном на коротких интернет-шутках с пометкой «юмор». Но газетный заголовок — это более тонкая материя. Например, чтобы понять заголовок «„Волгу“ не могут заставить течь быстрее», нужно знать, что «Волга» — это и река, и федеральная трасса.

В планах авторов — научить нейросети не только расшифровывать, но и генерировать качественные каламбуры.

Портал «Грамота.ру»

Еще на эту тему

ChatGPT не справился с пониманием метафор в речах Трампа

Модель дала неверную интерпретацию слов в трети случаев

Необычные игры в слова: пять вариантов для интеллектуальной вечеринки

Одна из них родилась после визита Индиры Ганди, а другая вдохновлена корпусной лингвистикой

Смех не без причины: лингвисты изучили языковые особенности «пирожков» и «порошков»

Новая книга Максима Кронгауза и Марии Ковшовой рассказывает об интернет-поэзии

все публикации

От копирайта до копилефта: как менялось авторское право на тексты

Почему «Гамлет» при жизни Шекспира принадлежал театральной труппе и чем важен спор вокруг Микки Мауса

Модные слова добавляют ярких красок в палитру общения

Ими хочется щеголять, но лучше делать это аккуратно, считают гости программы «Наблюдатель»

Возможно ли дешифровать письменность острова Пасхи?

Лингвист Евгения Коровина о тайне дощечек ронго-ронго

«Это роли не играет»: какие устойчивые словосочетания мы используем в речи

В программе «Наблюдатель» лингвисты рассказали о фразеологизмах из разных языков и культур 

Названия стран и народов: реальность меняется, а языковая норма остается?

Бирма стала Мьянмой, но нас больше волнуют Беларусь и Кыргызстан

В Метасловаре Грамоты есть возможность проверять ударения при подготовке к ЕГЭ по русскому языку

Все слова, вошедшие в орфоэпический словник, отмечены специальной плашкой

Учитель Сергей Валюгин: «Грамотный язык сближается с искусством»

О речи школьников, понимании Пушкина и о том, как владение языком становится новой ценностью

Семантические сдвиги: почему слова меняют смысл

Новые значения возникают не только в соответствии с языковыми законами, но и в результате ошибок

Пять мифов о том, как устроены естественные языки

Владимир Плунгян отделяет распространенные заблуждения от данных лингвистической науки

Должен ли извиняться этичный ИИ?

Лингвист Валерий Шульгинов готов прощать ботов только на определенных условиях

«Моя мама — копия ее мама»: что случилось с падежом

Лингвист Ирина Левонтина о причудах не генетики, но грамматики

Как используется слово «фидбэк» в современном русском языке

Вышел второй номер журнала «Русская речь» за 2026 год

Школьный жаргон XIX века: бонсюжешки ушли, а ерунда осталась

Про гимназическое прошлое многих слов мы даже не догадываемся

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!