Кто эффективнее в изучении языка — человек или нейросеть?

Похожи ли механизмы, которые заложены в нейросеть, на работу человеческого мозга? Есть ли разница в том, как язык усваивают дети и как это делает искусственный интеллект? Что думает про машинное обучение известный американский лингвист Ноам Хомский? Об этом изданию «N + 1» рассказала доктор филологических наук, ведущий научный сотрудник факультета гуманитарных наук Высшей школы экономики Наталия Слюсарь.
Язык — не набор инструкций
Невозможно обучить ребенка языку, просто перечислив ему правила, например объяснив падежи и склонения. Даже если бы лингвисты договорились о единой системе склонений, такой подход не был бы эффективен.
Обучение языку опирается на глубокие структурные принципы, которые ребенок постигает интуитивно.
Ноам Хомский недавно опубликовал статью в New York Times, где он утверждает, что ChatGPT не может по-настоящему понимать язык: он «мыслит» гораздо более линейно, нежели человек. Нейросеть легко способна освоить «невозможный язык» — этим термином лингвист называет любой гипотетический искусственный язык, основанный на линейном порядке слов. Такой «невозможный язык» человек либо не сможет выучить совсем, либо столкнется с большими трудностями, потому что в нем нарушены универсальные принципы естественных языков.
Не существует языка, в котором порядок слов был бы на 100% линейным: мозг всегда оперирует, а не просто считывает последовательность. ИИ далеко не всегда хорошо справляется с такой задачей, когда работает с естественными языками, что приводит к ошибкам. В частности, у нейросетей часто возникают проблемы с фразами вроде John is too stubborn to talk to (‘Джон слишком упрямый, чтобы с ним говорить’) — они могут неправильно перевести ее как ‘Джон такой упрямый, что ни с кем не говорит’.
Язык основан на иерархической структуре, где слова взаимодействуют друг с другом, а не просто следуют по порядку.
Он не подчиняется правилам вроде «поставь глагол на третье место в предложении». Например, в русском языке в предложении «Петя любит рис» глагол стоит на втором месте, а если мы скажем «Один умный мальчик, проповедующий здоровый образ жизни, любит рис», то сказуемое окажется далеко отодвинуто от начала предложения. То есть глагол занимает не вторую позицию от начала предложения, а позицию после первой синтаксической группы.
Ребенок против ИИ
По мнению Хомского, нейросеть осваивает язык иначе, чем человек: у машины отсутствуют какие-либо врожденные механизмы. Хотя наши знания о языке еще неполны, мы видим, что ребенок обучается языку в очень раннем возрасте и быстро осваивает базовую грамматику.
Для детей любые естественные языки одинаково просты, для них нет разницы между усвоением в качестве родного русского, английского, китайского или любого другого языка.
При этом если взрослый человек изучает искусственный язык, то для него, как показывает статистика, агглютинативные языки оказываются проще флективных — вне зависимости от того, на каком языке говорит сам человек. В агглютинативных языках аффикс имеет строго одно значение, а во флективных может иметь несколько: например, в слове столам окончание -ам указывает одновременно на дательный падеж и на множественное число.
Лингвисты обычно не говорят, что один естественный язык проще другого: у каждого есть свои особенности. Некоторые глобальные характеристики того или иного языка осваиваются чуть сложнее, а некоторые — проще.
Хомский уверен, что у людей есть некоторая врожденная способность к языку и огромные врожденные знания о том, какими языки бывают, а какими не бывают, — и ровно на это мы опираемся, когда осваиваем язык в детском возрасте. При том, что в нейросеть загружено гораздо большее количество данных, чем есть в голове у ребенка, человеческий мозг все равно оказывается эффективнее в вопросе изучения языка.
Неизвестно, смогут ли разработчики в будущем оптимизировать работу ИИ так, чтобы он начал работать по тем же принципам, что и наш мозг. Но исследования в этом направлении помогают ученым лучше понять, как устроен язык и человеческое сознание.
Еще на
эту тему
Запретные слова: что думают лингвисты о нецензурной лексике как части русского языка
В издательстве МИФ вышла научно-популярная книга двух докторов филологических наук
Таджики, негры и евреи: что исследует лингвистическая конфликтология
Сотрудники НИУ ВШЭ рассказали коллегам об этом научном направлении и о результатах своих экспериментов
Слово «пожалуйста» может быть избыточным
Представляем некоторые публикации в третьем номере журнала «Русская речь» за 2025 год
Язык всегда найдет способ заполнить лакуны
Лингвист Мария Ровинская дала интервью каналу «Мослекторий»
В среднем человек ругается 250 тысяч раз за жизнь — как к этому относиться?
Константин Деревянко, Ярослав Скворцов и Владимир Легойда обсудили ненормативную лексику