Нейросеть YandexGPT научилась пересказывать тексты на русском языке
Специалисты компании «Яндекс» научили нейросеть создавать выжимку из текстов на русском языке и представлять его основные идеи в виде тезисов. Статью объемом до 30 тысяч знаков можно сократить до небольшого конспекта в 300–1000 знаков.
Протестировать функцию может любой желающий, зайдя через «Яндекс.Браузер» на сайт 300.ya.ru. Нужно просто загрузить ссылку на нужный материал, и нейросеть переработает его. Тезисы появятся в том же окне. Ссылку на краткое содержание можно скопировать и поделиться с другими. Качество пересказа можно оценить или пожаловаться на него.
Создатели технологии отмечают, что она может пригодиться при подготовке докладов, аналитических статей и обзоров. Если на чтение статьи у пользователя ушло бы 15 минут, то чтение пересказа займет всего около минуты.
«Чтобы результат суммаризации передавал все важные мысли оригинального материала и был лаконичным, разработчики дополнительно обучили нейросеть YandexGPT с помощью особого набора данных. Это десятки тысяч пар больших текстов и их сокращенных версий», — заявили Российской газете разработчики.
Сейчас нейросеть находится в стадии бета-тестирования. Пока ей доступны только статьи (вставлять свой текст нельзя, только ссылку на веб-страницу). Но в будущем разработчики планируют обучить ее работать и с другими видами контента.
Впервые «Яндекс» представил функцию тезисного пересказа 27 июня, а неделю спустя выпустил доработанную версию. По словам руководителя проектного офиса разработки «Яндекс.Браузера» Ильи Шибанова, количество ошибок при пересказе уменьшилось в четыре раза.
Еще на
эту тему
«Академос» зафиксировал новые нормы написания популярных слов
Обновления отражают эволюцию орфографии при освоении заимствованной лексики
Можно ли писать «предиабет»? Кодификаторы прислушались к медицинскому сообществу
Письмо в редакцию Грамоты привело к пересмотру словарной фиксации
Власти Татарстана добились возвращения понятия «родной язык» в название школьного предмета
С нового учебного года предмет должен был называться «Язык народа Российской Федерации»
28–29 июля в Москве пройдет воркшоп по цифровой лексикографии
Специалисты из академических институтов, МГУ, НИУ ВШЭ поделятся своим опытом
16–17 октября в Твери пройдут Ожеговские чтения
Они приурочены к 125-летию выдающегося лингвиста