Подсказки для поиска

Понимают ли языковые модели игру слов?

Может ли искусственный интеллект оценить иронию в заголовке «Код накликал» или расшифровать отсылку в фразе «Особо бумажные персоны»? Задача непростая: например, чтобы понять, как устроен заголовок «Миссия сократима», нужно опознать скрытое в нем название фильма и учесть разные значения слова миссия. Чувствительность языковых моделей к каламбурам проверила международная команда лингвистов и экспертов по данным с участием специалистов факультета компьютерных наук НИУ ВШЭ.

Исследователи использовали специально сформированный масштабный корпус русских новостных заголовков с игрой слов — KoWit-24. В него вошли 2700 примеров из реальных СМИ за последние три года. Эксперимент проводили на пяти популярных моделях: GPT-4o, YandexGPT 4, GigaChat Lite, GigaChat Max и Mistral NeMo.

Перед моделями поставили две задачи: определить, есть ли в заголовке игра слов, и назвать исходную идиому или культурную отсылку.

Результаты оказались неоднозначными: обнаружить сам факт игры слов нейросетям оказалось проще, чем объяснить, в чем она заключаются. Модели часто «плавают», когда нужно восстановить фразу, ставшую основой для шутки. Самой «сообразительной» оказалась модель GPT-4o. Она показала наилучшую точность.

Также выяснилось, что контекст существенно влияет на успех. Нейросетям (как и людям) гораздо легче понять шутку, если дать им не только заголовок, но и «подводку» к новости. Если в промпте (запросе) подробно объяснить нейросети, что такое игра слов, и привести примеры, точность распознавания у большинства моделей растет.

Авторы отдельно отметили ключевую роль датасета. «KoWit-24 превращает подборку примеров в полноценный „тестовый стенд“ для ИИ. Теперь можно объективно оценивать, видит ли модель „якорь“ — ключевое слово, где происходит смысловой сдвиг», — отмечает Павел Браславский, доцент ФКН НИУ ВШЭ.

До сих пор модели обучались в основном на коротких интернет-шутках с пометкой «юмор». Но газетный заголовок — это более тонкая материя. Например, чтобы понять заголовок «„Волгу“ не могут заставить течь быстрее», нужно знать, что «Волга» — это и река, и федеральная трасса.

В планах авторов — научить нейросети не только расшифровывать, но и генерировать качественные каламбуры.

Портал «Грамота.ру»

Еще на эту тему

ChatGPT не справился с пониманием метафор в речах Трампа

Модель дала неверную интерпретацию слов в трети случаев

Необычные игры в слова: пять вариантов для интеллектуальной вечеринки

Одна из них родилась после визита Индиры Ганди, а другая вдохновлена корпусной лингвистикой

Смех не без причины: лингвисты изучили языковые особенности «пирожков» и «порошков»

Новая книга Максима Кронгауза и Марии Ковшовой рассказывает об интернет-поэзии

все публикации

Еще раз про любовь

Лингвист Ирина Левонтина изучает оттенки современного языка для отношений

От торговцев до сидельцев: история тайного языка коробейников

Кем были офени, зачем они меняли слова и как стали «отцами» воровского арго

Бог: как правильно писать и произносить

Для орфографии имеет значение, о каком божестве мы говорим

Ирина Фуфаева об истории феминитивов и о том, чем они бывают полезны

Негативное восприятие специальных наименований для женских профессий связано с языком бюрократии

Почему нельзя сказать «напишомое»?

Самые неожиданные вопросы справочной службе

Авторский стиль и манера общения: что показывает анализ сгенерированных текстов

Вышел четвертый номер журнала «Коммуникативные исследования» за 2025 год

Уважение, эмпатия и компетентность — три кита цифрового этикета 

Ольга Лукинова рассказала об этичном общении в интернете

Путешествие за языком: что такое полевая лингвистика

Лингвист Сергей Татевосов объясняет, почему малые языки интересуют науку не меньше, чем большие и известные

О чем говорят популярные слова 2025 года

Усталость от ИИ, абсурд и сложные эмоции

Разговор с ИИ-сторонним: что такое промпт как часть коммуникации

Валерий Шульгинов решил разобраться в лингвистической природе диалога с нейросетью

Как дети учатся говорить

Освоение языка на уровне родного происходит до 6–7 лет

Что такое геймерский жаргон и как он вышел за пределы игрового мира

«Заспавнил мобов» и «затащил катку» в переводе на русский литературный

«Живи себе нормальненько!»

Лингвист Ирина Левонтина — о языковой эволюции нормальности

Что подарить человеку читающему? Пять книг о языках и текстах

Языки можно учить, изучать и использовать для дела и удовольствия

Что означали эти слова в позднесоветскую эпоху?

Вспоминаем реалии прошлого, которые ушли из нашей жизни вместе с их названиями

Сергей Татевосов: «Наш язык — организм с прекрасной системой пищеварения»

Как меняется русский язык? Лингвисты по просьбе Грамоты рассказывают о главных трендах

Супер, гипер, мега и другие: найдите десять отличий в значении приставок

Есть ли что-то общее у Супермена с суперпозицией, а у гипертекста — с гипермаркетом

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!