Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
В последнее время искусственный интеллект далеко продвинулся в том, что касается работы с текстами. Однако искусственно сгенерированные тексты имеют характерные недостатки, так как нейросеть ограничена в понимании контекста, у нее отсутствует творческое мышление и критический анализ.
Первое, что бросается в глаза при чтении таких текстов, — повторяемость и шаблонность. Предложения часто имеют одну и ту же структуру и насыщены лексическими и синтаксическими клише. В частности, это может проявляться в обилии вводных слов вроде однако, в заключение, в результате. Если нейросеть обучена на новостных статьях, она будет постоянно вплетать в текст фразы по типу согласно источникам или в соответствии с данными. Такого рода повторы делают текст скучным и монотонным.
Другая особенность сгенерированных текстов — отсутствие глубины и оригинальности, так как у ИИ отсутствует личный опыт и эмоциональная вовлеченность, которые есть у человека. Нейросеть может лишь воспроизводить уже готовые идеи и формулировки, поэтому текст получается банальным и однообразным.
Несмотря на то что нейросети постоянно обучаются, в их текстах часто заметны структурные ошибки и нелогичность. ИИ старается предсказать наиболее вероятное следующее слово или фразу, однако он не всегда может понять сложные контексты и связи между частями текста — в результате происходит резкое переключение с одной темы на другую.
Также нейросеть может избыточно использовать ключевые слова (которые повышают рейтинг страницы в поисковой выдаче), если она обучена на SEO-текстах. ИИ не учитывает естественное течение языка и стиля, в итоге текст оказывается перенасыщен однотипными словами и фразами.
Понимание признаков, которые отличают искусственный текст от «живого», важно для развития самых разных сфер, в том числе журналистики и образования.
Еще на
эту тему
Что нейросети умеют делать с текстами и чем предстоит заняться человеку
Эксперты обсудили, как мы будем взаимодействовать с ИИ
Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей
Михаил Копотев о роли сгенерированных нейросетью текстов в развитии моделей и в жизни людей
Нейросеть — слово 2023 года по версии Грамоты
Выбор основан на анализе данных и опросе экспертного сообщества