Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»

6 июня 2024

В коллаже использованы материалы фотобанка Pexels

Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.

В последнее время искусственный интеллект далеко продвинулся в том, что касается работы с текстами. Однако искусственно сгенерированные тексты имеют характерные недостатки, так как нейросеть ограничена в понимании контекста, у нее отсутствует творческое мышление и критический анализ.

Первое, что бросается в глаза при чтении таких текстов, — повторяемость и шаблонность. Предложения часто имеют одну и ту же структуру и насыщены лексическими и синтаксическими клише. В частности, это может проявляться в обилии вводных слов вроде однако, в заключение, в результате. Если нейросеть обучена на новостных статьях, она будет постоянно вплетать в текст фразы по типу согласно источникам или в соответствии с данными. Такого рода повторы делают текст скучным и монотонным.

Другая особенность сгенерированных текстов — отсутствие глубины и оригинальности, так как у ИИ отсутствует личный опыт и эмоциональная вовлеченность, которые есть у человека. Нейросеть может лишь воспроизводить уже готовые идеи и формулировки, поэтому текст получается банальным и однообразным.

Несмотря на то что нейросети постоянно обучаются, в их текстах часто заметны структурные ошибки и нелогичность. ИИ старается предсказать наиболее вероятное следующее слово или фразу, однако он не всегда может понять сложные контексты и связи между частями текста — в результате происходит резкое переключение с одной темы на другую.

Также нейросеть может избыточно использовать ключевые слова (которые повышают рейтинг страницы в поисковой выдаче), если она обучена на SEO-текстах. ИИ не учитывает естественное течение языка и стиля, в итоге текст оказывается перенасыщен однотипными словами и фразами.

Понимание признаков, которые отличают искусственный текст от «живого», важно для развития самых разных сфер, в том числе журналистики и образования.

Портал «Грамота.ру»

Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»

Еще на эту тему

Что нейросети умеют делать с текстами и чем предстоит заняться человеку

Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Нейросеть — слово 2023 года по версии Грамоты

все публикации

Как правильно произносится это слово? Отвечают орфоэпические словари

Лучшие программы-корректоры на основе ИИ

Горячая десятка заимствований: что тут сложного?

Язык тела: как жесты помогают нам общаться

Елочки или лапки? Как правильно использовать кавычки

Какие новые жанры научно-популярных текстов о языке появились в новейшее время?

Мария Каленчук: «Да, мы ориентируемся на живую речь!»

Кто эффективнее в изучении языка — человек или нейросеть?

Не только люди: с кем еще мы разговариваем по душам?

Нейтральный язык эсперанто: благородная попытка объединить человечество

Что было написано на яблоке раздора? Тест на знание истории крылатых слов

Как пишутся сложные топонимы: правила и исключения

Попадает в самое сердечко... Почему теперь так говорят?

Лингвист Борис Орехов: «Корпус русской классики дает доступ в языковую лабораторию авторов»

Всё о чувствах и отношениях: почему язык психологии стал так популярен

Запретные слова: что думают лингвисты о нецензурной лексике как части русского языка

«Слова года» полгода спустя: кто продолжает забег

Под Пушкиным или под Пушкином? Как склонять города-фамилии

Как устроены языковые манипуляции

Что значит это региональное слово?