Подсказки для поиска

Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»

Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»
В коллаже использованы материалы фотобанка Pexels

Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.

В последнее время искусственный интеллект далеко продвинулся в том, что касается работы с текстами. Однако искусственно сгенерированные тексты имеют характерные недостатки, так как нейросеть ограничена в понимании контекста, у нее отсутствует творческое мышление и критический анализ. 

Первое, что бросается в глаза при чтении таких текстов, — повторяемость и шаблонность. Предложения часто имеют одну и ту же структуру и насыщены лексическими и синтаксическими клише. В частности, это может проявляться в обилии вводных слов вроде однако, в заключение, в результате. Если нейросеть обучена на новостных статьях, она будет постоянно вплетать в текст фразы по типу согласно источникам или в соответствии с данными. Такого рода повторы делают текст скучным и монотонным. 

Другая особенность сгенерированных текстов — отсутствие глубины и оригинальности, так как у ИИ отсутствует личный опыт и эмоциональная вовлеченность, которые есть у человека. Нейросеть может лишь воспроизводить уже готовые идеи и формулировки, поэтому текст получается банальным и однообразным. 

Несмотря на то что нейросети постоянно обучаются, в их текстах часто заметны структурные ошибки и нелогичность. ИИ старается предсказать наиболее вероятное следующее слово или фразу, однако он не всегда может понять сложные контексты и связи между частями текста — в результате происходит резкое переключение с одной темы на другую. 

Также нейросеть может избыточно использовать ключевые слова (которые повышают рейтинг страницы в поисковой выдаче), если она обучена на SEO-текстах. ИИ не учитывает естественное течение языка и стиля, в итоге текст оказывается перенасыщен однотипными словами и фразами. 

Понимание признаков, которые отличают искусственный текст от «живого», важно для развития самых разных сфер, в том числе журналистики и образования. 

Портал «Грамота.ру»

Еще на эту тему

Что нейросети умеют делать с текстами и чем предстоит заняться человеку

Эксперты обсудили, как мы будем взаимодействовать с ИИ

Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Михаил Копотев о роли сгенерированных нейросетью текстов в развитии моделей и в жизни людей

Нейросеть — слово 2023 года по версии Грамоты

Выбор основан на анализе данных и опросе экспертного сообщества

все публикации

10 слов, в которых нам наконец разрешили привычные варианты ударений

«Большой словарь ударений» признает влияние узуса на норму

Курс Владимира Плунгяна поможет разобраться в основах лингвистики

Уникальное свойство языка — делать мысль материальной

«Обязательная программа»: что общего есть у разных языков

Олег Беляев объясняет, как сравнение непохожих языков помогает понять логику их развития

Смешенье языков: можно ли скрестить русский с китайским?

Лингвист Валерий Шульгинов описывает свойства этого гибрида, опираясь на данные реальных пиджинов

Как русский язык помогает осваивать другие школьные предметы

Рассказывают учителя — финалисты четвертого сезона проекта «Классная тема!»

Что значит «залететь в реки»?

Лингвист Ирина Левонтина изучила новые употребления русского приставочного глагола

Зачем нужно сохранять исчезающие языки

Лингвист Ольга Казакевич — о ценности языкового разнообразия для человека и общества

Псевдо, квази, эрзац и другие: пять способов указать на неполное сходство

Чем отличаются разные виды «фейков» с лингвистической точки зрения

Русский язык не сводится к его литературной форме. Лекция Максима Кронгауза

Субстандарт: питательная среда или испытательный полигон?

Откуда берутся разные варианты произношения?

Вышла книга Марии Каленчук об орфоэпических словарях

Одушевленное и неодушевленное в языке: как в этом разобраться

Почему мы встречаем важного клиента, но на компьютер устанавливаем клиент

Изоляты — языки без «родственников»

Как получилось, что им не нашлось места ни в одной языковой семье?

Берестяные грамоты находят даже в вечной мерзлоте

Алексей Гиппиус рассказал об итогах раскопок 2025 года

Лингвист Наталья Брагина о вежливости и конфликтной коммуникации в XXI веке

В выпуске программы «Говорим по-русски!» рассказали о том, как интонация и частицы могут сделать вежливое высказывание грубым

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!