Подсказки для поиска

В России создали систему распознавания речи для диалекта карельского языка

Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) завершили разработку уникальной системы распознавания речи для ливвиковского наречия карельского языка, сообщает ТАСС.

По данным ученых, в мире на карельском говорят около 30 тысяч человек, из которых 25 тысяч живут в России. При этом в повседневном общении его используют лишь 5–7 тысяч носителей.

«Изучение карельского имеет огромное значение не только для сохранения культурного наследия, но и для поддержки языковой традиции его носителей. Создание системы распознавания карельской речи — один из способов если не возродить, то хотя бы задокументировать этот язык», — рассказала Ирина Кипяткова, старший научный сотрудник Лаборатории речевых и многомодальных интерфейсов СПб ФИЦ РАН.

Главной сложностью при разработке системы стал недостаток электронных данных на карельском языке. Для обучения модели исследователи использовали тексты из открытого корпуса вепсского и карельского языков ВепКар и других источников, а также собрали два набора данных разговорной речи.

Особенностью новой системы является учет реальных особенностей использования карельского языка, когда носители часто смешивают карельский и русский в повседневной речи.

«Кроме нашей системы, в мире есть лишь одна модель, поддерживающая карельский язык. Однако она многоязычная и обучалась на очень небольшом объеме данных, что снижает точность распознавания именно карельской речи», — отмечает Ирина Кипяткова.

Технология в перспективе позволит переводить устную речь в режиме реального времени и станет частью онлайн-переводчика с использованием искусственного интеллекта. На первом этапе система будет работать как компьютерное приложение, распознающее звук с микрофона. В будущем ее планируют адаптировать для смартфонов, чтобы технологией могли пользоваться не только ученые.

Портал «Грамота.ру»

Еще на эту тему

Как сохранить нивхский и другие малые языки? Интервью лингвиста Павла Гращенкова

Языки ценны не только как культурное наследие, но и как источник данных для науки

Сотни представителей народов Севера и Дальнего Востока привлекут к исследованию их языков

Такое исследование входит в программу экспедиций «Чистая Арктика — Восток-77» и «Россия 360»

Как цифровизация помогает сохранить языки коренных народов России

Голосовые помощники, цифровые учебники и онлайн-переводчики вносят вклад в создание языковой среды

все публикации

Кринж или не кринж? Лингвистический взгляд на чувство неловкости в коммуникации

Валерий Шульгинов пытается понять, какие ситуации мы описываем этим словом и почему

В Ухане или в Ухани? Как выяснить тип склонения иностранного топонима

Первый шаг — определить, насколько это название привычное и есть ли похожие на него русские слова

Как редакционная политика повышает качество текстов

Что в ней должно быть и кто заинтересован в том, чтобы она работала

Слово «пожалуйста» может быть избыточным

Представляем некоторые публикации в третьем номере журнала «Русская речь» за 2025 год

Свое среди чужих: попробуйте отличить исконно русское слово от заимствований

Десять примеров того, что разница между «местными» и «чужаками» со временем перестает быть заметной

Стенография: как поймать слова на лету

От мраморных плит до современных программ

Чем опасны «бесы орфографии»?

Не надо искать в приставке нечистую силу и злой умысел

Язык всегда найдет способ заполнить лакуны

Лингвист Мария Ровинская дала интервью каналу «Мослекторий»

Александр Пушкин, главный инфлюенсер русского языка

Его влияние на то, как мы говорим и пишем, сохраняется спустя двести лет

В среднем человек ругается 250 тысяч раз за жизнь — как к этому относиться?

Константин Деревянко, Ярослав Скворцов и Владимир Легойда обсудили ненормативную лексику

Тест: знаете ли вы значение этих устаревших слов?

Увраж, палаш, ажитация и еще семь слов, которые мы больше не используем

Я вижу, значит, я понимаю: как устроены метафоры восприятия

Лингвист Валерий Шульгинов о мыслях в животе, текучем времени и связи слуха с послушанием

Страсти вокруг нормы

Светлана Друговейко-Должанская о том, почему кодификация языковых явлений не может строиться на личных предпочтениях

Лингвист Алексей Шмелев: «У слова „столько“ есть полная парадигма единственного числа»

«Правмир» поговорил о русском языке и лингвистике с председателем Орфографической комиссии РАН

Практическое руководство по использованию эмодзи: как избежать конфуза

Результаты нашего опроса и маленький словарик в помощь сомневающимся

Как образуются новые слова: старые модели, новые потребности

Полуногав для турникмэна и улучшайзинг человейника

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!