Подсказки для поиска

Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»

Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»
В коллаже использованы материалы фотобанка Pexels

Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.

В последнее время искусственный интеллект далеко продвинулся в том, что касается работы с текстами. Однако искусственно сгенерированные тексты имеют характерные недостатки, так как нейросеть ограничена в понимании контекста, у нее отсутствует творческое мышление и критический анализ. 

Первое, что бросается в глаза при чтении таких текстов, — повторяемость и шаблонность. Предложения часто имеют одну и ту же структуру и насыщены лексическими и синтаксическими клише. В частности, это может проявляться в обилии вводных слов вроде однако, в заключение, в результате. Если нейросеть обучена на новостных статьях, она будет постоянно вплетать в текст фразы по типу согласно источникам или в соответствии с данными. Такого рода повторы делают текст скучным и монотонным. 

Другая особенность сгенерированных текстов — отсутствие глубины и оригинальности, так как у ИИ отсутствует личный опыт и эмоциональная вовлеченность, которые есть у человека. Нейросеть может лишь воспроизводить уже готовые идеи и формулировки, поэтому текст получается банальным и однообразным. 

Несмотря на то что нейросети постоянно обучаются, в их текстах часто заметны структурные ошибки и нелогичность. ИИ старается предсказать наиболее вероятное следующее слово или фразу, однако он не всегда может понять сложные контексты и связи между частями текста — в результате происходит резкое переключение с одной темы на другую. 

Также нейросеть может избыточно использовать ключевые слова (которые повышают рейтинг страницы в поисковой выдаче), если она обучена на SEO-текстах. ИИ не учитывает естественное течение языка и стиля, в итоге текст оказывается перенасыщен однотипными словами и фразами. 

Понимание признаков, которые отличают искусственный текст от «живого», важно для развития самых разных сфер, в том числе журналистики и образования. 

Портал «Грамота.ру»

Еще на эту тему

Что нейросети умеют делать с текстами и чем предстоит заняться человеку

Эксперты обсудили, как мы будем взаимодействовать с ИИ

Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Михаил Копотев о роли сгенерированных нейросетью текстов в развитии моделей и в жизни людей

Нейросеть — слово 2023 года по версии Грамоты

Выбор основан на анализе данных и опросе экспертного сообщества

все публикации

Лучшие программы-корректоры на основе ИИ

Роботы уже могут исправить большинство ошибок, но сами добавляют новые

Горячая десятка заимствований: что тут сложного?

Пользователи Грамоты часто ищут информацию об этих заимствованиях, которые еще не освоились в русском языке

Язык тела: как жесты помогают нам общаться

Они дополняют, уточняют и даже заменяют слова

Елочки или лапки? Как правильно использовать кавычки

Они нужны для оформления прямой речи, цитат, названий, а также слов, использованных иронически

Мария Каленчук: «Да, мы ориентируемся на живую речь!»

В издательстве «Грамота» вышел Большой словарь ударений

Кто эффективнее в изучении языка — человек или нейросеть?

«Язык опирается на врожденную систему знаний», — объясняет лингвист Наталия Слюсарь

Не только люди: с кем еще мы разговариваем по душам?

Лингвист Валерий Шульгинов напоминает, что до появления чат-ботов люди охотно общались со стихиями, куклами и техникой

Нейтральный язык эсперанто: благородная попытка объединить человечество

Был ли шанс у этого проекта, на который доктор Заменгоф потратил многие годы?

Что было написано на яблоке раздора? Тест на знание истории крылатых слов

Часто мы используем устойчивые выражения, точный смысл которых от нас ускользает

Как пишутся сложные топонимы: правила и исключения

Ново-Огарево отличается от Новосибирска, как Соль-Илецк от Сольвычегодска

Попадает в самое сердечко... Почему теперь так говорят?

Лингвист Ирина Фуфаева ищет причины экспансии этого диминутива в современной речи

Лингвист Борис Орехов: «Корпус русской классики дает доступ в языковую лабораторию авторов»

В Национальном корпусе русского языка теперь можно изучать и сравнивать языки писателей XIX века

Всё о чувствах и отношениях: почему язык психологии стал так популярен

Лингвисты, социологи и психологи обсуждают вред и пользу психотерапевтической волны в русском языке

Запретные слова: что думают лингвисты о нецензурной лексике как части русского языка

В издательстве МИФ вышла научно-популярная книга двух докторов филологических наук

«Слова года» полгода спустя: кто продолжает забег

Насколько точным был прошлогодний выбор Грамоты и как чувствуют себя «наши» неологизмы сегодня

Как устроены языковые манипуляции

Эти приемы используют публицисты, политики, телефонные мошенники и даже родственники

Что значит это региональное слово?

Не только «поребрик» и «мультифора» выдают малую родину говорящего

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!