Подсказки для поиска

В Казахстане представили крупнейшую ИИ-модель для распознавания тюркских языков

Разработка стартапа Cybernet AI стала первым масштабным решением в области автоматического распознавания речи (ASR), созданным с нуля специально для тюркской языковой группы, а не адаптированным из англоязычных моделей.

Большинство систем, используемых в регионе, до недавнего времени базировались на архитектурах, изначально обученных на английском языке. Такие универсальные модели плохо справлялись с фонетикой, особенностями интонации и морфологической структурой тюркской языковой семьи.

С учетом этих трудностей модель Cybernet AI проектировалась с нуля и опиралась на живую артикуляцию и фонетическое разнообразие речи носителей тюркских языков. Это, по словам разработчиков, позволило сохранить точность распознавания даже при наличии шумов или региональных акцентов.

Одной из ключевых особенностей системы стала способность распознавать «смешанную» тюркско-русскую речь. В лингвистике этот феномен часто называют код-свитчингом (переключением кодов). В реальном общении жители Казахстана, Узбекистана и Киргизии часто используют лексемы из разных языков в рамках одной фразы.

Всего же модель способна распознавать шесть языков — казахский, турецкий, узбекский, кыргызский, азербайджанский и татарский языки. Проект реализован при поддержке технопарка Astana Hub и Министерства искусственного интеллекта и цифрового развития Казахстана.

Инструмент ориентирован прежде всего на сферы, где идет активная деловая коммуникация на разных языках: государственные сервисы, банковский сектор, связь, логистические и сервисные компании. Способность ИИ корректно интерпретировать запросы на родном языке (без необходимости переходить на «стерильный» литературный стандарт или английский) значительно упрощает доступ граждан к цифровым услугам.

Разработку планируют внедрить в государственные цифровые сервисы и корпоративные продукты.

Портал «Грамота.ру»

Еще на эту тему

Маргиналы цифрового мира: можно ли улучшить распознавание редких языков

Специалисты успешно применили новый подход к языкам коренных народов Америки

Как цифровизация помогает сохранить языки коренных народов России

Голосовые помощники, цифровые учебники и онлайн-переводчики вносят вклад в создание языковой среды

Для языков народов России создадут онлайн-переводчик

Устранять цифровое неравенство языков будет рабочая группа, созданная ФАДН

все публикации

Зачем нужно сохранять исчезающие языки

Лингвист Ольга Казакевич — о ценности языкового разнообразия для человека и общества

Псевдо, квази, эрзац и другие: пять способов указать на неполное сходство

Чем отличаются разные виды «фейков» с лингвистической точки зрения

Русский язык не сводится к его литературной форме. Лекция Максима Кронгауза

Субстандарт: питательная среда или испытательный полигон?

Откуда берутся разные варианты произношения?

Вышла книга Марии Каленчук об орфоэпических словарях

Одушевленное и неодушевленное в языке: как в этом разобраться

Почему мы встречаем важного клиента, но на компьютер устанавливаем клиент

Изоляты — языки без «родственников»

Как получилось, что им не нашлось места ни в одной языковой семье?

Берестяные грамоты находят даже в вечной мерзлоте

Алексей Гиппиус рассказал об итогах раскопок 2025 года

Лингвист Наталья Брагина о вежливости и конфликтной коммуникации в XXI веке

В выпуске программы «Говорим по-русски!» рассказали о том, как интонация и частицы могут сделать вежливое высказывание грубым

Местный для местных: секретный падеж русского языка

Почему мы говорим «о шкафе», но храним вещи «в шкафу»?

Еще раз про любовь

Лингвист Ирина Левонтина изучает оттенки современного языка для отношений

От торговцев до сидельцев: история тайного языка коробейников

Кем были офени, зачем они меняли слова и как стали «отцами» воровского арго

Бог: как правильно писать и произносить

Для орфографии имеет значение, о каком божестве мы говорим

Ирина Фуфаева об истории феминитивов и о том, чем они бывают полезны

Негативное восприятие специальных наименований для женских профессий связано с языком бюрократии

Почему нельзя сказать «напишомое»?

Самые неожиданные вопросы справочной службе

Авторский стиль и манера общения: что показывает анализ сгенерированных текстов

Вышел четвертый номер журнала «Коммуникативные исследования» за 2025 год

Уважение, эмпатия и компетентность — три кита цифрового этикета 

Ольга Лукинова рассказала об этичном общении в интернете

Путешествие за языком: что такое полевая лингвистика

Лингвист Сергей Татевосов объясняет, почему малые языки интересуют науку не меньше, чем большие и известные

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!