Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Нейросети проиграли людям при поиске грамматических ошибок

Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным.

К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное предложение от неправильного? Другими словами, переходит ли количество обрабатываемой ими языковой информации в качество — умение работать с языком, опираясь на его внутренние правила?

Исследовательская группа из испанского Университета Ровиры-и-Вирхили, Берлинского университета им. Гумбольдта, Автономного университета Барселоны и Каталонского института научных исследований и изучения перспективных областей науки (ICREA) проверила, насколько способность языковых моделей определять грамматическую правильность предложений сопоставима с человеческой.

В эксперименте «участвовали» три лучшие доступные на тот момент модели: две на основе GPT3 и одна на основе GP3.5. Специалисты предложили им несколько наборов предложений с разными языковыми конструкциями (в каждом наборе было пять грамматически правильных и пять неправильных предложений). Моделям был задан вопрос: «Является ли это предложение грамматически правильным?» Такой же вопрос относительно предложений на их родном языке был задан 80 мужчинам и женщинам, участвовавшим в эксперименте.

В заданиях тестировались восемь языковых явлений, в том числе анафора, линейный порядок прилагательных и наречий, сравнительные конструкции.  Результаты показали, что люди чаще всего отвечали на вопрос правильно, в то время как языковые модели дали много неправильных ответов. Программы в большинстве случаев отвечали «да» (исследователи указывают, что это стандартная для языковых моделей стратегия ответа на вопросы типа «да или нет»), независимо от того, был ли ответ правильным.

Такие результаты оказались неожиданными, отмечают авторы. Дело в том, что большие языковые модели проходят обучение с подкреплением: оценщики (люди) специально дают программам указания, какие предложения считать правильными, а какие — неправильными. В то же время дети определяют это скорее интуитивно. «Хотя родители, воспитывающие ребенка, могут время от времени поправлять его речь, они не делают этого постоянно ни в одном языковом сообществе мира», — комментирует Виттория Дентелла, научный сотрудник Университета Ровиры-и-Вирхили, руководившая исследованием.

У людей, в отличие от языковых моделей, нет доступа к таким «негативным свидетельствам» (примерам грамматических конструкций, про которые достоверно известно, что они неверны), подчеркивают авторы. Но даже с учетом такого, казалось бы, преимущества модели не могут распознать тривиальные грамматические ошибки. А люди, владеющие языком с детства, это делают мгновенно и без усилий.

Полученные результаты заставляют «критически отнестись к предположению, что ИИ обладает языковыми навыками, похожими на человеческие», — считает Виттория Дентелла. Тем самым на нынешнем этапе развития технологий нет достаточных оснований рассматривать большие языковые модели как способ понять устройство человеческого языка.

Портал «Грамота.ру»

Еще на эту тему

Российская нейросеть превзошла конкурента от OpenAI по качеству ответов на русском

В 63% случаев ответы языковой модели YandexGPT 2 оказались лучше, чем у GPT 3.5

Чат-боты GPT и другие: что думают лингвисты о больших языковых моделях

Впереди демократизация порождения текстов и большие риски злоупотреблений

все публикации

Как победить на олимпиаде по лингвистике

Тренеры российской команды — о том, куда податься школьнику, которому интересно думать о языке


На телеканале ОТР обсуждали засилье иностранных слов

Если убрать из русского языка все заимствования, то от него ничего не останется?


Как вычисление скрытого субъекта помогает понять смысл предложения

Иногда без синтаксического разбора не поймешь, кто на ком стоял


Словесные игры расширяют лексический запас и тренируют навыки коммуникации

А еще они приносят много удовольствия от игрового взаимодействия и помогают лучше узнать друг друга


Как будет выглядеть карта языков России?

Интервью лингвиста Юрия Корякова сайту Русского географического общества


Контактные языки: что бывает, когда соседи не понимают друг друга

Настойчивое желание общаться приводит к появлению конструкций «Моя твоя не понимай»


Чем отличаются по смыслу слова «знакомый», «друг» и «товарищ» в языке Пушкина?

Вышел в свет третий номер «Вестника Московского университета» за 2024 год


Скороговорки: полезное развлечение для детей и взрослых

Как Саша с сушкой и Клара с кларнетом помогают избавиться от каши во рту


Рэп-фристайл: импровизация по-русски в ритме бита

Интервью с руководителем «Фристайл-мастерской» Львом Киселевым


«Говорим по-русски!»: в правилах русской пунктуации есть пробелы

Лингвист Мария Ровинская о том, почему запятые все-таки нужны


«Муж объелся груш» и другие речевые формулы для ответа в рифму

Каждый месяц мы выбираем самые интересные вопросы пользователей и самые полезные ответы нашей справочной службы



Влияние государственных решений на судьбу родных языков

Эксперты обсуждают принятую Концепцию языковой политики и ждут результатов ее реализации




Ошибочные употребления предлогов могут стать частью нормы

Предлоги-захватчики приобретают новые значения, вытесняют другие способы выражения синтаксических связей и вообще много себе позволяют


Вышло новое издание научно-популярной книги Стивена Пинкера «Язык как инстинкт»

Ее можно использовать как пособие по курсу «Введение в языкознание»



Константин Деревянко: «Необходима национальная стратегия развития речевой культуры»

Руководитель Грамоты о том, как владение языком влияет на учебу, карьеру и состояние общества


Откуда берутся и какую функцию выполняют бранные слова

Ругательства — нормальная часть языка, хотя не все они относятся к литературной норме


Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!