Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»

Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»
В коллаже использованы материалы фотобанка Pexels

Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.

В последнее время искусственный интеллект далеко продвинулся в том, что касается работы с текстами. Однако искусственно сгенерированные тексты имеют характерные недостатки, так как нейросеть ограничена в понимании контекста, у нее отсутствует творческое мышление и критический анализ. 

Первое, что бросается в глаза при чтении таких текстов, — повторяемость и шаблонность. Предложения часто имеют одну и ту же структуру и насыщены лексическими и синтаксическими клише. В частности, это может проявляться в обилии вводных слов вроде однако, в заключение, в результате. Если нейросеть обучена на новостных статьях, она будет постоянно вплетать в текст фразы по типу согласно источникам или в соответствии с данными. Такого рода повторы делают текст скучным и монотонным. 

Другая особенность сгенерированных текстов — отсутствие глубины и оригинальности, так как у ИИ отсутствует личный опыт и эмоциональная вовлеченность, которые есть у человека. Нейросеть может лишь воспроизводить уже готовые идеи и формулировки, поэтому текст получается банальным и однообразным. 

Несмотря на то что нейросети постоянно обучаются, в их текстах часто заметны структурные ошибки и нелогичность. ИИ старается предсказать наиболее вероятное следующее слово или фразу, однако он не всегда может понять сложные контексты и связи между частями текста — в результате происходит резкое переключение с одной темы на другую. 

Также нейросеть может избыточно использовать ключевые слова (которые повышают рейтинг страницы в поисковой выдаче), если она обучена на SEO-текстах. ИИ не учитывает естественное течение языка и стиля, в итоге текст оказывается перенасыщен однотипными словами и фразами. 

Понимание признаков, которые отличают искусственный текст от «живого», важно для развития самых разных сфер, в том числе журналистики и образования. 

Портал «Грамота.ру»

Еще на эту тему

Что нейросети умеют делать с текстами и чем предстоит заняться человеку

Эксперты обсудили, как мы будем взаимодействовать с ИИ

Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Михаил Копотев о роли сгенерированных нейросетью текстов в развитии моделей и в жизни людей

Нейросеть — слово 2023 года по версии Грамоты

Выбор основан на анализе данных и опросе экспертного сообщества

все публикации

Сколько падежей в русском языке на самом деле

Сторонники идеи «чем больше, тем лучше» ищут и находят скрытые падежи


Как современные технологии помогают оценить сложность текста

Инструменты компьютерной лингвистики лучше всего работают с учебными материалами


В языке все уже изучено или ученым есть чем заняться?

В телепередаче «Наблюдатель» члены Российской академии наук обсуждали самое интересное в науке о языке


Новый толковый словарь — источник точной и интересной информации для школьника

Авторы рассказывают, как устроен словарь и как его можно использовать на уроках и дома


Как разное понимание языковой нормы приводит к коммуникативным неудачам

Выступление научного консультанта Грамоты Владимира Пахомова на конференции «Медиатекст: векторы развития и перспективы изучения» 


Наш человек! Как появились и что значат названия народов — этнонимы

От имен легендарных прародителей до прозвищ, данных соседями


Шепот на ухо и бесконечный пазл: две истории о переводе с турецкого

Тюрколог Аполлинария Аврутина переводила не только Орхана Памука, но и суфийскую поэзию XIII века


Вышел в свет второй выпуск журнала «Русская речь» за 2024 год

В нем анализируют такие языковые единицы, как «босяки», «верги» и «зеленые береты»


Мягенький заинька у плохонькой березоньки: по каким правилам пишутся уменьшительно-ласкательные суффиксы?

Каждый месяц мы выбираем и комментируем три вопроса, на которые ответила наша справочная служба



Вышел в подарочном издании «Словарь поэтических иносказаний Пушкина» Валерия Сомова

Автор считал этот словарь кентавром: «По форме — справочник, по сути же — книга для занимательного чтения»


Подкаст «Что это значит?» проясняет смысл необычных современных слов

Даже если вы избегаете новых заимствований, полезно понимать, откуда взялись ретрит, косты и непо-бейбис


Функции и характерные черты публицистического стиля речи

Он предназначен для СМИ, выступлений и публицистической литературы


Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Михаил Копотев о роли сгенерированных нейросетью текстов в развитии моделей и в жизни людей


В Москве прошла первая стратегическая сессия «Информационные технологии и языки народов России»

Мероприятие организовано Домом народов России при поддержке ФАДН России


Русский язык как государственный: что означает этот статус

Когда средство общения становится символом страны и национальным достоянием



Два брата и два алфавита: история изобретения славянской письменности

Кирилл и Мефодий вместе с учениками придумали не только буквы, но и язык