Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Новогодняя игра: Грамота предсказывает будущее. Хочу погадать!
Хочу погадать!

Что нейросети умеют делать с текстами и чем предстоит заняться человеку

Что нейросети умеют делать с текстами и чем предстоит заняться человеку
В коллаже использованы материалы фотобанка Unsplash

Нейросети уже неплохо справляются с анализом и порождением текстов, они умеют многое из того, что раньше делали только люди. Какие возможности это дает? Участники круглого стола «Ай да AI. Нейросети и создание текстов: проблемы и перспективы генеративных моделей» обсудили, чем ИИ может помочь в научной работе и какие навыки понадобятся людям в цифровую эпоху. Грамота записала самое главное. 

В дискуссии на Костомаровском форуме участвовали руководитель лаборатории «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ, доктор физико-математических наук Константин Воронцов, руководитель образовательной программы «Цифровые методы в гуманитарных науках» НИУ ВШЭ, кандидат филологических наук Борис Орехов и директор по стратегическим коммуникациям Brand Analytics Василий Черный. Модерировала встречу Мария Лебедева, кандидат филологических наук, руководитель образовательного направления Грамоты и заведующая лабораторией когнитивных и лингвистических исследований Института Пушкина. 

Нейросеть как инструмент 

Все желающие уже успели убедиться в том, что нейросети научились генерировать тексты: они редактируют, переводят, сокращают, пересказывают и составляют аннотации. Если еще недавно сообщение о том, что ученый написал статью совместно с нейросетью, было сенсацией, то сейчас одни исследователи делают это, не афишируя, а другие — открыто говорят об этом. Так, в статье «Способен ли ИИ написать статью в юридический журнал?» описан эксперимент по проверке гипотезы, вынесенной в заглавие: первая часть статьи была полностью сгенерирована искусственным интеллектом.

Как нейросети и генеративные модели помогают ученым работать с научными текстами? Массив таких текстов огромен, а их переработка требует времени и сил.

Нейросети могут помочь, в частности, в поиске релевантных статей, их упорядочивании, в создании аннотаций.

В Институте искусственного интеллекта МГУ под руководством Константина Воронцова работает проект «Мастерская знаний», где на основе нейросети SciRus-tiny создается поисково-рекомендательная система, призванная облегчить работу с результатами поисковой выдачи по научным текстам. С ее помощью можно создавать тематические подборки, структурировать и ранжировать информацию, а также получать сообщения о новых публикациях по выбранной теме. Тестирование этой системы началось в 2024 году; нейросеть и набор тестовых задач находятся в открытом доступе. 

Участники круглого стола
Участники круглого стола

В античности знание было диалогичным, устным и не фиксировалось, напомнила Мария Лебедева. Затем произошла трансформация: устную речь научились записывать, стали хранить и распространять эти записи. Сейчас мы живем в парадигме, где научное знание скорее монологично и излагается в виде текста. Но наступает момент, когда текстов становится слишком много, и нейросеть помогает «выплыть» в этом море информации. С Марией Лебедевой согласен Константин Воронцов.

Слишком много букв — это не претензия неграмотной молодежи, а состояние современной цивилизации. Константин Воронцов

Человечество вплотную подошло к новому цивилизационному барьеру, и сегодня нужно использовать новые инструменты и навыки для того, чтобы выбирать самое главное.

Проблема авторства

Использование новых инструментов ставит вопросы: если создать тематическую подборку и выбрать из статей цитаты теперь можно с помощью ИИ, то в чем заключается роль исследователя?  Сохранится ли, к примеру, реферат как форма проверки знаний студентов? 

Ведущая роль в создании обзора принадлежит человеку, считает Константин Воронцов: у человека есть авторский замысел и цель; когда он пишет обзор для диссертации, статьи или заявки на грант, то в зависимости от цели ставит задачи своему ИИ-помощнику.

В какой момент исследования следует подключать технологии? Для кого они предназначены: мы помогаем автору писать обзор или читателю в нужном порядке осваивать информацию? Такой дилеммы никогда не было, но сейчас технологии подвели нас к тому моменту, когда нам придется дать ответ на этот вопрос.

Нейросети довольно быстро меняют и нашу повседневную жизнь. Например, уже существует немало инструментов, которые безошибочно транскрибируют видеоконференции, переводя голос сразу в текст.

ИИ-ассистенты могут подготовить в текстовом виде итоги любого совещания быстрее и лучше, чем это сделает человек.

Но тексты, сгенерированные с помощью ИИ, нуждаются в тщательной проверке. Ученые пока не смогли справиться с феноменом галлюцинаций нейросетей. Поэтому для пользователей важна верификация информации, а для специалистов — качество массива текстов, на которых проводится обучение ИИ.

Мария Лебедева привела пример таких рисков. Специалисты Грамоты попросили нейросеть ответить на вопросы о русском языке, которые поступают в справочную службу. Выяснилось, что нейросеть в большинстве случаев ошибалась, придумывая свои правила русского языка или ссылаясь на нерелевантные. 

Директор по стратегическим коммуникациям Brand Analytics Василий Черный
Директор по стратегическим коммуникациям Brand Analytics Василий Черный

А вот материалы в интернете, посвященные искусственному интеллекту и нейросетям, чат BrandGPT анализирует вполне успешно, считает Василий Черный. Компания BransAnalitics разрабатывает системы анализа социальных медиа и классических СМИ, в том числе отслеживает тенденции в области ИИ. Например, анализ показывает, что количество контента, посвященного ИИ и нейросетям, за год выросло в два раза, а интерес к конкретным нейросетям, генерирующим изображения, сегодня выше, чем к генераторам текста. 

Борис Орехов сравнил роль автора в естественных науках со вкладом автора в гуманитарных исследованиях и художественных текстах.

В гуманитарных науках отделить текст от знания невозможно. Индивидуальный стиль Гаспарова, Бахтина, Лотмана неотделим от содержания их работ.

Теоретически большая языковая модель со временем может заменить гуманитария. Возникает вопрос: чем человек как производитель текста лучше, чем генеративная модель? А что, если выяснится, что искусственный интеллект может генерировать художественные тексты? Будут ли такие тексты экспериментом или полноценным художественным произведением? И кто тогда будет автором?

Создание массовой развлекательной литературы может быть отдано ИИ, но место для писателя-человека в литературе безусловно останется. «Мне интересно, когда живой человек делится со мной своим жизненным опытом, мыслями о мире и так далее. Ради этого я читаю художественную литературу», — заметил Константин Воронцов.

Что делать людям в эпоху нейросетей

Выделять главное и строить схемы

Справиться с гигантским объемом данных нам поможет структуризация знаний. Константин Воронцов предлагает научить людей выделять главное и строить схемы, чтобы затем передать это умение следующей генерации больших языковых моделей. Важными навыками для людей в информационную эпоху становятся составление текстографических материалов, так называемых карт мыслей (интеллект-карт, ментальных карт) и питчинг — умение быстро рассказать о самом важном, чтобы завладеть вниманием аудитории. 

Руководитель лаборатории «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ Константин Воронцов
Руководитель лаборатории «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ Константин Воронцов

Писать промпты и интерпретировать собранные данные

Василий Черный настроен скорее оптимистично. Он сравнивает автора, работающего в паре с ИИ, с колумнистом, который пишет свою колонку по материалам газеты за неделю и обладает для издания большей ценностью, чем любые новостники.

Роль человека в том, чтобы анализировать и интерпретировать полученные нейросетью результаты.Василий Черный

С другой стороны, написание текстового запроса пользователя (промпта), по которому нейросеть генерирует контент, имеет все шансы когда-нибудь стать отдельной отраслью и отдельной профессией. Никакой боязни остаться без работы в среде тех, кто имеет дело с ИИ, нет: работы все равно очень много. Если мы правильно обучаем ИИ, он многое может делать, но инноватором он пока не является. 

Адаптироваться к цифровому миру

Год назад, когда нейросеть Midjourney доказала, что ИИ может создавать реалистичные изображения, это вызвало панику в стане фотографов, напомнил Василий Черный. Прошел год, страсти улеглись, и выяснилось, что человеческий глаз способен отличить сгенерированные изображения. Фешен-индустрия откликнулась трендом на реализм и отказом от обработки изображений, чтобы дистанцироваться от продукции ИИ. Таким образом, фотографы нашли свою нишу.

Вообще, вполне может быть, что модели станут полноправными акторами и нашими партнерами: сейчас мы помогаем этим сущностям работать, но мы на самом деле не знаем, что происходит у них внутри. Уже сейчас в исследовательской индустрии получили мощное развитие синтетические респонденты, потом будут синтетические исследователи, затем потребители будут виртуализироваться, и так возникнет параллельный виртуальный мир.

Руководитель образовательной программы «Цифровые методы в гуманитарных науках» НИУ ВШЭ Борис Орехов
Руководитель образовательной программы «Цифровые методы в гуманитарных науках» НИУ ВШЭ Борис Орехов

Борис Орехов назвал эту картину будущего прекрасной и суммировал ее так: одни нейросети будут генерировать тексты, другие нейросети будут их читать, а мы сможем «пойти на речку за червячками».

Заниматься тем, что интересно

Казалось бы, зачем вообще генерировать художественные тексты? В этом есть смысл, даже если пока непонятно, зачем это нужно, уверен Борис Орехов.

Если бы у Резерфорда спросили, зачем он изучает ядро атома, я не уверен, что его ответ убедил бы всех. Но через полвека ценность этих работ стала очевидна. Борис Орехов

Практической ценности у сгененированной литературы может не быть, но это не значит, что надо немедленно прекратить этим заниматься. У людей должна быть возможность заниматься тем, что им интересно.

Создавать позитивные образы будущего

Люди должны не только прогнозировать будущее с учетом появления ИИ, но и активно конструировать его, считает Константин Воронцов. Например, легко представить себе, что персональный помощник, который слушает совещания, читает книги, ведет вашу переписку, работает с вами десятилетиями, постепенно становится слепком вашей личности. Он обладает сверхвозможностями и может продолжать работу после вашей смерти, стать суперсотрудником для вашего работодателя или ангелом-хранителем для ваших потомков, которые смогут обратиться к нему за советом. Подобные сценарии могут стать реальностью в цифровом будущем, их нужно разрабатывать и к ним готовиться.

, редактор Грамоты

Еще на эту тему

Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Михаил Копотев о роли сгенерированных нейросетью текстов в развитии моделей и в жизни людей

В Институте Пушкина завершился IV Костомаровский форум

Участники обсудили не только преподавание и продвижение русского языка, но также медиатексты, вежливость, словари и нейросети

Машинный диалект: границы рефлексии

Взгляд лингвиста Бориса Орехова на язык нейросетей

все публикации


Как измерить сложность и сбалансированность языка в учебниках?

Об этом — статья Антонины Лапошиной и Марии Лебедевой в журнале «Русский язык в школе»



Тест: в каком предложении правильно расставлены запятые?

Вспоминаем, как оформляются причастные обороты, однородные члены предложения и вводные слова


Шиликун в озере и постен на стене: как в разных регионах зовется хтонь 

Лингвист Ирина Фуфаева о происхождении названия одного псковского домового


Ненецкий счет, русское яканье и экзотический язык Новой Гвинеи на портале «Элементы»

Решение лингвистических задач позволяет нелингвистам больше узнать об устройстве языка


Необычные игры в слова: пять вариантов для интеллектуальной вечеринки

Одна из них родилась после визита Индиры Ганди, а другая вдохновлена корпусной лингвистикой



Что такое достаточно хорошая речь сегодня: главные критерии

Хорошая речь по-прежнему должна быть чистой, точной, ясной, но в первую очередь — уместной


Как чаще всего возникали неологизмы в коронавирусную эпоху

Словообразование и фразеология в шестом номере журнала «Русская речь» за 2024 год


Новогодний тест: где нужны прописные буквы?

Проверьте, хорошо ли вы помните правила правописания слов и выражений, которые нужны раз в году



Фантастические слова в поисковых запросах Грамоты: окказионализмы 2024 года

Омбомодор, пледовитая и мангобездарь ковшкручинятся из-за вырожжерика


Смех не без причины: лингвисты изучили языковые особенности «пирожков» и «порошков»

Новая книга Максима Кронгауза и Марии Ковшовой рассказывает об интернет-поэзии



Математик Константин Воронцов: «Текст становится тормозом развития цивилизации»

Специалист по цифровой гуманитаристике — о том, как нейросети меняют работу с языком и к чему стоит готовиться педагогам


Язык поколений: в чем разница между лексиконами зумеров, миллениалов, бумеров и иксеров

Поколенческие черты не ограничиваются лексиконом, но лингвисты не видят языковых препятствий для взаимопонимания



Тест: как правильно расставить ударения?

Двадцать не самых сложных и очень нужных слов, в которых лучше не ошибаться


«Почему он не читает?» Книга советов Алихана Динаева для родителей, учителей и других взрослых

Какова бы ни была причина, автор предлагает не опускать руки и искать свой способ приобщить ребенка к радостям чтения


1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!