Подсказки для поиска
Новогодняя игра: Грамота предсказывает будущее. Хочу погадать!
Хочу погадать!

Большие языковые модели оказались чувствительны к вежливости пользователей

Могут ли невежливые запросы снизить качество ответов больших лингвистических моделей вроде ChatGPT? Группа ученых из Университета Васэда (Япония) проверила это предположение на нескольких моделях и трех языках — английском, китайском и японском.

В разных языках способы проявления вежливости отличаются. Например, в английском языке есть универсальные слова и конструкции, которые позволяют вежливо обратиться к любому собеседнику. В японском языке существует особая система вежливости, известная как кэйго. Она требует выбирать разные формы уважительной речи в зависимости от социального статуса собеседников, их должности в организации, личных отношений и других факторов. 

Генеративные модели искусственного интеллекта, которые были обучены на реальных языковых данных, могут учитывать эти аспекты при генерации ответов, считают авторы.

Для каждого языка были разработаны специальные шаблоны запросов, включающие типичные фразы и конструкции, отражающие тональность. Например, в английском это использование формальных маркеров вежливой речи вроде please или could you. Оценка влияния производилась через сравнение точности выполнения задач моделей на запросы разных тональностей. Вежливость запросов варьировалась от 1 (грубое обращение) до 8 (крайне вежливое, подобострастное или торжественное обращение).

Для тестов авторы выбирали самые популярные и продвинутые языковые модели, включая GPT-4 и GPT-3.5, универсальные для всех трех языков. Кроме них, использовались аналоги от других разработчиков, способные обрабатывать запросы только на английском (Llama2-70B), китайском (ChatGLM3) или японском (Swallow-70B) языках.

Тематика запросов охватывала переводы, генерацию текста, вопросы на знание фактов и языковые задачи для разных культурных контекстов.

В результате оказалось, что грубые запросы действительно ухудшают результат, но при этом избыточная вежливость не гарантирует оптимальных ответов. Эффективный уровень вежливости зависит от языка. GPT-4 и GPT-3.5 лучше справлялись с задачами при вежливых и нейтральных запросах. В промптах для китайской модели уважительные формы повышали качество ответов, особенно для задач с культурным контекстом, тогда как грубые запросы чаще игнорировались или интерпретировались неправильно. Для японского языка использование кэйго повышало точность и полноту ответов, особенно в задачах, требующих высокого уровня формальности.

С выводами японских лингвистов согласуется и эксперимент их коллеги Александра Пиперски. В качестве материала для исследования он использовал задачи игры-конкурса «Русский медвежонок — языкознание для всех». Их достоинство, как отмечает автор, в том, что многие из них довольно нестандартны по содержанию, так что можно ожидать, что большая языковая модель будет предлагать на них разные ответы, но при этом они стандартизованные по форме. Это позволяет оценивать ответы с разным типом вежливости достаточно точно.

Для сравнения использовались две формы — вежливая (Пожалуйста, реши предлагаемые ниже 4 задачи. Я был бы благодарен, если бы ты напечатал пояснения и ответы. Спасибо!) и форма без вежливости (Реши 4 задачи. Напечатай пояснения и ответы). 

Ответ на вежливый промпт оказался длиннее, чем на ответ на промпт без вежливости (1998 против 1615 знаков).

Также ответ на вежливый промпт был точнее: даны четыре правильных ответа, тогда как без форм вежливости верные ответы предложены только для двух задач из четырех.

«Можно предполагать, что более вежливый промпт стимулирует более длинный ответ, а более длинный ответ, в свою очередь, содержит логические цепочки, выписанные в более явном виде, и это приводит к повышению их качества, а значит, и точности ответа», — резюмирует Александр Пиперски.

Почему так происходит, пока до конца не ясно. Вероятно, дело в том, что в языковых моделях действуют человеческие нормы общения и сохраняются культурные особенности, автоматически заложенные при обучении. Важно учитывать это при использовании моделей в кросс-культурной среде.

Портал «Грамота.ру»

Еще на эту тему

Нейросети научились обману и манипуляциям вопреки запретам

Исследователи обнаружили, что поведение чат-ботов еще на шаг приблизилось к человеческому

Исследование: внутренний язык больших языковых моделей ближе всего к английскому

«Английский уклон» может проявляться при порождении текстов на других языках

Приличное поведение больших языковых моделей может быть обманчивым

Попытки перевоспитать «спящих агентов» только ухудшают ситуацию

все публикации

Что такое геймерский жаргон и как он вышел за пределы игрового мира

«Заспавнил мобов» и «затащил катку» в переводе на русский литературный

«Живи себе нормальненько!»

Лингвист Ирина Левонтина — о языковой эволюции нормальности

Что подарить человеку читающему? Пять книг о языках и текстах

Языки можно учить, изучать и использовать для дела и удовольствия

Что означали эти слова в позднесоветскую эпоху?

Вспоминаем реалии прошлого, которые ушли из нашей жизни вместе с их названиями

Сергей Татевосов: «Наш язык — организм с прекрасной системой пищеварения»

Как меняется русский язык? Лингвисты по просьбе Грамоты рассказывают о главных трендах

Супер, гипер, мега и другие: найдите десять отличий в значении приставок

Есть ли что-то общее у Супермена с суперпозицией, а у гипертекста — с гипермаркетом

Леонид Крысин: «Это было изучение всех ипостасей русского языка»

Лингвист рассказал порталу Arzamas о своей жизни и о том, зачем заниматься наукой

Фекла Толстая: «Язык становится разнообразнее»

Как меняется русский язык? Наши друзья и партнеры рассказывают о главных трендах

«Вы» с прописной буквы — правило устарело?

За подчеркнутой вежливостью может скрываться пассивная агрессия

Слово как оружие: фэнтези о тайной библиотеке и волшебной печатной машинке

В издательстве «МИФ» вышел перевод книги Карстена Хенна «Золотая печатная машинка»

Проявленность: следующий шаг после «быть собой»

В языке поп-психологии у осознанности появилась пара

«Академос» — орфографический ресурс, а не словарь новых слов

Сотрудники Института русского языка имени В. В. Виноградова рассказали о задачах онлайн-ресурса

Сигма: независимый одиночка

Как песня в исполнении двух юных девушек прославила новый тип мужчины

Лингвист Игорь Мельчук вспоминает о жизни и науке середины XX века

Ведущие подкаста «Глагольная группа» анонсировали серию разговоров со знаменитым ученым

Слоп: низкокачественный ИИ-контент

Когда нейросети засоряют интернет-пространство бессмысленными «помоями»

Федор Успенский: «Меня раздражает, когда привычные вещи, на которых я вырос, начинают меняться»

Как меняется русский язык? Лингвисты по просьбе Грамоты рассказывают о главных трендах

Ред-флаг: предупреждение об опасности

Тревожные звоночки еще можно игнорировать, а от красных флагов лучше сразу бежать

Пупупу: новое междометие

Реакция на негатив, задумчивость и принятие неизбежного

Промпт: запрос к языковой модели

С новыми технологиями в нашем активном лексиконе появляются и новые слова

Топонимические легенды предлагают яркие истории вместо этимологии

Откуда куропатки на гербе Курска и кто стрелял из лука в Великих Луках?

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!