Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Российские исследователи предложили новую модель генерации ключевых слов к научным текстам

Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь.

Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом случае классификация может быть неполной. Например, для слов и словосочетаний нейросеть, большая языковая модель и машинное обучение можно подобрать обобщающий термин искусственный интеллект. Однако в тексте его может и не быть. Другими словами, важно, чтобы алгоритм не только находил ключевые слова в тексте, но и добавлял слова, семантически связанные с содержанием текста.

Исследователи из Института проблем передачи информации им. Харкевича РАН и их коллеги с кафедры программного обеспечения Школы компьютерных наук ТюмГУ предложили новый подход к генерации ключевых слов для русскоязычных научных текстов. Они использовали модель mT5, которая хорошо зарекомендовала себя в автоматическом реферировании русскоязычных текстов.

Что нейросети умеют делать с текстами и чем предстоит заняться человекуЭксперты обсудили, как мы будем взаимодействовать с ИИВ результате использования модели список ключевых слов, относящихся к теме анализируемых текстов, расширился. В выбранном корпусе доля ключевых слов, не встречающихся в текстах в явном виде, составила 53,17% для обучающей выборки и 54,8% — для тестовой.  

При этом у примененного подхода есть ограничения. Использование mT5 для генерации ключевых слов потребовало дообучения на текстах из определенной предметной области. При использовании ее для текстов других предметных областей результаты могут быть не такими точными. Ведь чем более специфична обучающая выборка, тем более точными будут результаты генерации.

Портал «Грамота.ру»

Еще на эту тему

Научный стиль: точность не в ущерб понятности

Им пользуются авторы учебников, исследователи, лекторы, научные журналисты

Искусственный интеллект научили создавать конспекты научных статей

Разработчики надеются, что это поможет повысить доступность информации

Чат-боты GPT и другие: что думают лингвисты о больших языковых моделях

Впереди демократизация порождения текстов и большие риски злоупотреблений

все публикации


Безударные гласные в некоторых словах могут редуцироваться до нуля

Вышел четвертый выпуск журнала «Русская речь» за 2024 год


Как в русском языке возникали названия для новых профессий

Ирина Фуфаева — о трех случаях, когда родное слово оттеснило иностранного конкурента


Для чего нужен язык в первую очередь

Нейробиологи пришли к выводу, что мышление может существовать и без языка


На полях манускрипта Войнича обнаружили полный латинский алфавит

Мультиспектральный анализ загадочной рукописи помог сделать открытие



В открытом доступе выложен «Словарь языковой экономии»

Филолог Василий Химик собрал блестящую коллекцию универбов от авиационки до ядовитки


Чем отличаются правила речевого этикета в русских и английских письменных текстах

Мария Елифёрова о том, почему «представители семейства кошачьих» требуют от переводчика аккуратности


Фекла Толстая: «Мы можем создать не 3D, а 10D-картинку Толстого»

Как цифровая форма приближает к нам тексты, события и обстоятельства




Художественный стиль речи использует всю палитру языковых средств

Творец может свободно обращаться со словами, если этого требует его замысел


Как научиться говорить грамотно и выразительно во взрослом возрасте

Развитие речевой культуры предполагает ликвидацию пробелов в знаниях и опору на сильные стороны говорящего




Школа игры на рояле без струн

Переводчик Наталья Мавлевич о преодолении интертекстуального малокровия и культурной глухоты


Вышел третий выпуск журнала «Слово.ру: Балтийский акцент» за 2024 год

«Мама» вытесняет «мать» как способ указания на родственную связь, а «чувак» обрел вторую жизнь благодаря молодежи


Хайп, кринж и краш на всю страну: зачем медиа используют молодежный язык

Просвещение, эксперименты и кодовый язык для тех, кто «в теме»



Самые необычные словари русского языка: от морфем до новоторов и Андропы-Расторопы

Они устроены не так, как мы привыкли, и показывают язык с неожиданной стороны


1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!