Подсказки для поиска

В России создали систему распознавания речи для диалекта карельского языка

Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) завершили разработку уникальной системы распознавания речи для ливвиковского наречия карельского языка, сообщает ТАСС.

По данным ученых, в мире на карельском говорят около 30 тысяч человек, из которых 25 тысяч живут в России. При этом в повседневном общении его используют лишь 5–7 тысяч носителей.

«Изучение карельского имеет огромное значение не только для сохранения культурного наследия, но и для поддержки языковой традиции его носителей. Создание системы распознавания карельской речи — один из способов если не возродить, то хотя бы задокументировать этот язык», — рассказала Ирина Кипяткова, старший научный сотрудник Лаборатории речевых и многомодальных интерфейсов СПб ФИЦ РАН.

Главной сложностью при разработке системы стал недостаток электронных данных на карельском языке. Для обучения модели исследователи использовали тексты из открытого корпуса вепсского и карельского языков ВепКар и других источников, а также собрали два набора данных разговорной речи.

Особенностью новой системы является учет реальных особенностей использования карельского языка, когда носители часто смешивают карельский и русский в повседневной речи.

«Кроме нашей системы, в мире есть лишь одна модель, поддерживающая карельский язык. Однако она многоязычная и обучалась на очень небольшом объеме данных, что снижает точность распознавания именно карельской речи», — отмечает Ирина Кипяткова.

Технология в перспективе позволит переводить устную речь в режиме реального времени и станет частью онлайн-переводчика с использованием искусственного интеллекта. На первом этапе система будет работать как компьютерное приложение, распознающее звук с микрофона. В будущем ее планируют адаптировать для смартфонов, чтобы технологией могли пользоваться не только ученые.

Портал «Грамота.ру»

Еще на эту тему

Как сохранить нивхский и другие малые языки? Интервью лингвиста Павла Гращенкова

Языки ценны не только как культурное наследие, но и как источник данных для науки

Сотни представителей народов Севера и Дальнего Востока привлекут к исследованию их языков

Такое исследование входит в программу экспедиций «Чистая Арктика — Восток-77» и «Россия 360»

Как цифровизация помогает сохранить языки коренных народов России

Голосовые помощники, цифровые учебники и онлайн-переводчики вносят вклад в создание языковой среды

все публикации

Плеоназмы со смыслом, неологизмы для мужчин и всякие штуки: вышел новый номер «Трудов ИРЯ РАН»

Кое-что о современной русской лексике в сборнике статей к 90-летию Леонида Крысина

Владимир Гиляровский, «король репортеров»

К 170-летию со дня рождения писателя и журналиста Музей Москвы показывает документы из найденного недавно архива 

Он или она? Как языки обходятся без указания на пол

Есть разные способы избежать уточнения или, наоборот, внести ясность

Могут ли нейросети написать «Войну и мир» и куда они заведут человечество

На форуме «Территория будущего. Москва 2030» рассказали о возможностях ИИ

Слова на карте: как лексика объединяет и разделяет страны

Лингвистические карты показывают родство языков и языковые контакты

Сергей Ожегов, борец за самобытность родного языка

К 125-летию со дня рождения лексикографа рассказываем о десяти фактах его биографии

Калеб Эверетт написал книгу о языковом многообразии

Научный редактор книги Валерий Шульгинов представляет ее читателям Грамоты

Как эвфемизмы в рекламе влияют на наше поведение

«Спецпредложение» звучит более заманчиво, чем «скидка»

А и Б сидели на трубе: семь детских книг о буквах и знаках

Иногда А, Я и даже точка могут стать главными героями поучительных историй

Опять запятые! Сложный пунктуационный тест

Десять цитат из русской классики, которые нужно написать без ошибок

Михаил Штудинер не спешит изгонять из языка то, что в нем еще живо

Автор «Словаря трудностей русского языка» — об объективном характере нормы и ее субъективной фиксации

Как менялись библиотеки?

История книжных коллекций от собраний табличек до храмов литературы в новой книге МИФа

Новое образование для «нового человека»: как учили грамоте в советской школе сто лет назад

31 августа исполняется сто лет декрету о всеобщем начальном обучении в РСФСР

Язык и пространство: что находится в центре мира?

Реки, горы и стороны света могут быть встроены в языковую систему координат, объясняет Валерий Шульгинов

Курсы лекций Ирины Кобозевой и Андрея Кибрика доступны на платформе Teach-in

Не нужно быть студентом, чтобы погрузиться в лексическую семантику и ареальную лингвистику

Как философы пытались создать идеальные языки

Продуманные, точные — но абсолютно непригодные для общения

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!