Подсказки для поиска

Нейросеть выучилась понимать язык без использования текстовых данных

Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки.

Один из альтернативных подходов — позволить машинам учиться так, как учатся дети. А именно используя разные типы данных, между которыми изначально есть очевидные связи (например, видеоряд и звуковая дорожка, которая относится к нему). В голове у детей естественным образом формируются связи, причем у слова возникает целый спектр ассоциаций.

По этому пути пошли исследователи из Массачусетского технологического института, Оксфордского университета и компаний Google и Microsoft. Они разработали модель, получившую название DenseAV. Ее обучили «понимать» на основании аудиоинформации, о чем идет речь, и искать соответствующие видеофрагменты — и наоборот, при просмотре беззвучного видео находить возможные звуковые соответствия.

При чем же тут язык? Например, когда мы слышим фразу Испеките торт при температуре 180 градусов, мы, скорее всего, видим на экране торт и духовку. Чтобы добиться успеха в этой игре на поиск соответствий между аудио и видео среди миллионов фрагментов, модель должна сформировать единое понятие, которое связывает спектр визуальных образов и спектр звуков.

Перед тестированием DenseAV обучили с использованием двух миллионов видеороликов с YouTube, а также других видео. Причем данные не были предварительно размечены — модель сама «догадывалась», как связать видео и звук в единый сюжет. Модель также не была предварительно обучена на каких-либо текстовых данных; она сама выделяла слова из массива аудиоданных.

Авторы работы могли наблюдать, какие детали видеоряда модель выделяет в ответ на предъявленные ей звуки. Например, при слове собака она выделяла изображения собак и связывала их с произносимым словом. Интересно, что модель «опознавала» собаку и в звуках собачьего лая, показывая, что ей под силу создавать ассоциации на основе признаков, которые отсылают к понятию.

По словам ведущего автора работы Марка Хэмилтона, на проведение опыта его команду вдохновил фильм «Марш пингвинов». В одной из сцен пингвин идет по льду и падает, после чего издает короткий прерывистый крик. «Почти очевидно, что этот крик означает слово из четырех букв на английском», — иронизирует Хэмилтон. Шутки шутками, однако подобные опыты могут открыть дорогу и к пониманию разных способов общения между животными.

Портал «Грамота.ру»

Еще на эту тему

Искусственный интеллект помог создать фонетический «алфавит» кашалотов

Исследователи вычислили базовые звуки, из которых киты составляют большой репертуар фраз

Искусственный интеллект научился частично понимать птичий язык

Исследователи смогут объяснить фермерам, как улучшить условия выращивания домашних кур

Нейросеть научилась распознавать задуманные слова по активности мозга

Это может помочь пациентам с речевыми расстройствами

все публикации

Авторский стиль и манера общения: что показывает анализ сгенерированных текстов

Вышел четвертый номер журнала «Коммуникативные исследования» за 2025 год

Уважение, эмпатия и компетентность — три кита цифрового этикета 

Ольга Лукинова рассказала об этичном общении в интернете

Путешествие за языком: что такое полевая лингвистика

Лингвист Сергей Татевосов объясняет, почему малые языки интересуют науку не меньше, чем большие и известные

О чем говорят популярные слова 2025 года

Усталость от ИИ, абсурд и сложные эмоции

Разговор с ИИ-сторонним: что такое промпт как часть коммуникации

Валерий Шульгинов решил разобраться в лингвистической природе диалога с нейросетью

Как дети учатся говорить

Освоение языка на уровне родного происходит до 6–7 лет

Что такое геймерский жаргон и как он вышел за пределы игрового мира

«Заспавнил мобов» и «затащил катку» в переводе на русский литературный

«Живи себе нормальненько!»

Лингвист Ирина Левонтина — о языковой эволюции нормальности

Что подарить человеку читающему? Пять книг о языках и текстах

Языки можно учить, изучать и использовать для дела и удовольствия

Что означали эти слова в позднесоветскую эпоху?

Вспоминаем реалии прошлого, которые ушли из нашей жизни вместе с их названиями

Сергей Татевосов: «Наш язык — организм с прекрасной системой пищеварения»

Как меняется русский язык? Лингвисты по просьбе Грамоты рассказывают о главных трендах

Супер, гипер, мега и другие: найдите десять отличий в значении приставок

Есть ли что-то общее у Супермена с суперпозицией, а у гипертекста — с гипермаркетом

Леонид Крысин: «Это было изучение всех ипостасей русского языка»

Лингвист рассказал порталу Arzamas о своей жизни и о том, зачем заниматься наукой

Фекла Толстая: «Язык становится разнообразнее»

Как меняется русский язык? Наши друзья и партнеры рассказывают о главных трендах

«Вы» с прописной буквы — правило устарело?

За подчеркнутой вежливостью может скрываться пассивная агрессия

Слово как оружие: фэнтези о тайной библиотеке и волшебной печатной машинке

В издательстве «МИФ» вышел перевод книги Карстена Хенна «Золотая печатная машинка»

Проявленность: следующий шаг после «быть собой»

В языке поп-психологии у осознанности появилась пара

«Академос» — орфографический ресурс, а не словарь новых слов

Сотрудники Института русского языка имени В. В. Виноградова рассказали о задачах онлайн-ресурса

Сигма: независимый одиночка

Как песня в исполнении двух юных девушек прославила новый тип мужчины

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!