Новую технологию распознавания сгенерированных текстов разрабатывают в НИУ ВШЭ
Число текстов, сгенерированных искусственным интеллектом, в последние годы растет в геометрической прогрессии. И качество таких текстов постоянно улучшается. А это значит, что определить, к примеру, реальное авторство учебной работы будет все труднее. Ведь текст, порожденный нейросетями, выглядит уникальным, его не распознаёт проверка инструментами вроде «Антиплагиата». Однако справиться с этой задачей обещают исследователи Высшей школы экономики.
Подпроект «Поймай бота: семантические пространства дополненного ума» относится к большому стратегическому проекту НИУ ВШЭ «Устойчивый мозг: нейрокогнитивные технологии адаптации, обучения, развития и реабилитации человека в изменяющейся среде». «Поимка бота» предполагает создание универсальной системы обнаружения сгенерированных текстов.
«Подавляющее большинство аналогичных проектов посвящено задаче идентификации конкретных архитектур генеративных языковых моделей (к примеру, ChatGPT). Это приводит к неизбежному устареванию таких наработок по мере развития инструментов генерации текстов и (или) возникновения новых типов ботов, а также вынуждает потенциальных потребителей использовать на практике сразу несколько моделей, ответственных за обнаружение ботов с различными архитектурами. Мы „ловим“ всех ботов, а не только одного или нескольких, находящихся в нашем распоряжении», — рассказывает руководитель проекта Василий Громов, профессор департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ.
Авторы хотят в скором времени начать тестирование прототипа на разных типах текстов — от художественных произведений до выпускных квалификационных работ студентов НИУ ВШЭ. Сделать платформу широко доступной планируется в 2025 году. Сначала она будет работать с текстами на русском и английском языках, а позднее разработчики добавят поддержку языков народов России и стран БРИКС.
Еще на
эту тему
Языковые модели оказались хорошими помощниками в написании рассказов — но не для всех
В способности к творчеству моделям пока далеко до человека
Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»
ИИ не способен к оригинальному мышлению и творческому осмыслению информации
Что нейросети умеют делать с текстами и чем предстоит заняться человеку
Эксперты обсудили, как мы будем взаимодействовать с ИИ