Новую технологию распознавания сгенерированных текстов разрабатывают в НИУ ВШЭ

23 июля 2024

Число текстов, сгенерированных искусственным интеллектом, в последние годы растет в геометрической прогрессии. И качество таких текстов постоянно улучшается. А это значит, что определить, к примеру, реальное авторство учебной работы будет все труднее. Ведь текст, порожденный нейросетями, выглядит уникальным, его не распознаёт проверка инструментами вроде «Антиплагиата». Однако справиться с этой задачей обещают исследователи Высшей школы экономики.

Подпроект «Поймай бота: семантические пространства дополненного ума» относится к большому стратегическому проекту НИУ ВШЭ «Устойчивый мозг: нейрокогнитивные технологии адаптации, обучения, развития и реабилитации человека в изменяющейся среде». «Поимка бота» предполагает создание универсальной системы обнаружения сгенерированных текстов.

«Подавляющее большинство аналогичных проектов посвящено задаче идентификации конкретных архитектур генеративных языковых моделей (к примеру, ChatGPT). Это приводит к неизбежному устареванию таких наработок по мере развития инструментов генерации текстов и (или) возникновения новых типов ботов, а также вынуждает потенциальных потребителей использовать на практике сразу несколько моделей, ответственных за обнаружение ботов с различными архитектурами. Мы „ловим“ всех ботов, а не только одного или нескольких, находящихся в нашем распоряжении», — рассказывает руководитель проекта Василий Громов, профессор департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ.

Авторы хотят в скором времени начать тестирование прототипа на разных типах текстов — от художественных произведений до выпускных квалификационных работ студентов НИУ ВШЭ. Сделать платформу широко доступной планируется в 2025 году. Сначала она будет работать с текстами на русском и английском языках, а позднее разработчики добавят поддержку языков народов России и стран БРИКС.

Портал «Грамота.ру»

Новую технологию распознавания сгенерированных текстов разрабатывают в НИУ ВШЭ

Еще на эту тему

Языковые модели оказались хорошими помощниками в написании рассказов — но не для всех

Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»

Что нейросети умеют делать с текстами и чем предстоит заняться человеку

все публикации

Лучшие программы-корректоры на основе ИИ

Горячая десятка заимствований: что тут сложного?

Язык тела: как жесты помогают нам общаться

Елочки или лапки? Как правильно использовать кавычки

Какие новые жанры научно-популярных текстов о языке появились в новейшее время?

Мария Каленчук: «Да, мы ориентируемся на живую речь!»

Кто эффективнее в изучении языка — человек или нейросеть?

Не только люди: с кем еще мы разговариваем по душам?

Нейтральный язык эсперанто: благородная попытка объединить человечество

Что было написано на яблоке раздора? Тест на знание истории крылатых слов

Как пишутся сложные топонимы: правила и исключения

Попадает в самое сердечко... Почему теперь так говорят?

Лингвист Борис Орехов: «Корпус русской классики дает доступ в языковую лабораторию авторов»

Всё о чувствах и отношениях: почему язык психологии стал так популярен

Запретные слова: что думают лингвисты о нецензурной лексике как части русского языка

«Слова года» полгода спустя: кто продолжает забег

Под Пушкиным или под Пушкином? Как склонять города-фамилии

Как устроены языковые манипуляции

Что значит это региональное слово?

Высок как гора, застенчив как барышня: что фразеология сообщает о культурно-языковой картине мире