Языковые модели хуже обрабатывают середину текста

25 июня 2025

Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U).

Что это означает? Например, если модели нужно распознать текст, процент ошибок (согласно статистике) будет выше в середине. Такой же эффект возникает, когда модель обобщает большие тексты, выбирает необходимую информацию из истории болезней, помогает работать с академическими текстами.

Научная группа, возглавляемая Синьи Ву, построила модель для объяснения феномена такой неравномерности обработки. Были протестированы 163 модели, в том числе популярные Claude, GPT-4 и Gemini. Оказалось, у всех моделей точность поиска информации понижается примерно на 25% именно в средней части текста. При этом у человека такого падения не наблюдается.

Дело в специфическом устройстве внимания языковых моделей. Они просматривают текст последовательно, но больше значения придают участкам, которые помогают понять смысл. Поскольку самые важные слова чаще всего находятся в начале и в конце текста, модель фокусируется на них. На такое поведение влияют и особенности обучения модели. Если тексты, которые вошли в обучающую выборку, были четко структурированы и содержали обобщающие блоки в начале и в конце (например, обучающие тексты, инструкции, статьи), модель «привыкнет» к тому, что этим частям нужно уделять больше внимания.

Авторы уверены, что их открытие позволит улучшить работу языковых моделей. Уже в мае 2025 года они начали тестировать новые настройки внимания, которые повысили точность в середине текста на 15–20%.

Портал «Грамота.ру»

Языковые модели хуже обрабатывают середину текста

Еще на эту тему

Исследование: ИИ-помощники не справляются с пересказом новостей

В онлайн-продаже обнаружены книги о сборе грибов, сгенерированные нейросетями

Нейросети проиграли людям при поиске грамматических ошибок

все публикации

«Это роли не играет»: какие устойчивые словосочетания мы используем в речи

Названия стран и народов: реальность меняется, а языковая норма остается?

В Метасловаре Грамоты есть возможность проверять ударения при подготовке к ЕГЭ по русскому языку

Учитель Сергей Валюгин: «Грамотный язык сближается с искусством»

Семантические сдвиги: почему слова меняют смысл

Вышел в свет словарь «Традиционная пища Среднего Урала» под редакцией Елены Березович

Пять мифов о том, как устроены естественные языки

«Мне не зашло, а ему откликается»: сленговые конструкции для выражения эмоций

Должен ли извиняться этичный ИИ?

«Моя мама — копия ее мама»: что случилось с падежом

Как используется слово «фидбэк» в современном русском языке

Школьный жаргон XIX века: бонсюжешки ушли, а ерунда осталась

Составители «Академоса» рассказали о выборе слов для орфографического словаря и их кодификации

Как редполитика помогает Госуслугам оставаться понятными для всех

10 слов, в которых нам наконец разрешили привычные варианты ударений

Федор Успенский рассказал о бранных и «звериных» именах в русской традиции

Ограничение избыточных заимствований: что и как придется менять

Курс Владимира Плунгяна поможет разобраться в основах лингвистики

«Морж», «сельдь» и другие финно-угорские и скандинавские заимствования в русском языке

«Обязательная программа»: что общего есть у разных языков