Роспатент выдал свидетельство о регистрации Национального корпуса удмуртского языка
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН.
Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В дальнейшем предполагается создание корпусов диалектных, параллельных и других текстов.
Система дает возможность искать определенные словоформы и сочетания, поиск по грамматическим показателям, авторам, годам публикации, подкорпусам, просматривать морфологический разбор слова и т. п. Помимо массива текстов, на сайте есть электронные версии Удмуртско-русского (2008 год) и Русско-удмуртского (2019 год) словарей. Для поиска удмуртских слов можно использовать специальную панель для ввода букв ӝ, ӟ, ӥ, ӧ, ӵ.

Партнерами УдмФИЦ УрО РАН стали министерство национальной политики Удмуртской Республики, Национальная библиотека Удмуртской Республики и ООО «Нооматика». Проект был реализован в рамках плана мероприятий к столетию государственности Удмуртии (2020 год).
Корпус размещен по адресу: http://udmcorpus.udman.ru/
Еще на
эту тему
Кому и зачем нужен Национальный корпус русского языка
Получить всю картотеку одним кликом и другие, менее очевидные возможности специальных корпусов
Для языков народов России создадут онлайн-переводчик
Устранять цифровое неравенство языков будет рабочая группа, созданная ФАДН
Академик РАН Владимир Плунгян о языках России
В России есть не только русский язык