В Кызыле объявили о создании Национального корпуса тувинского языка
О начале работы над корпусом объявили участники круглого стола, прошедшего в Тувинском институте гуманитарных и прикладных социально-экономических исследований (ТИГПИ) 22 июня. Круглый стол был посвящен 95-летию тувинской письменности и проводился в рамках Международного десятилетия языков коренных народов под эгидой ЮНЕСКО.
Новый корпус будет насчитывать более 20 млн словоупотреблений, в том числе из газетного корпуса (около 10 млн), параллельного корпуса (5 млн), поэтического (около 1 млн), фольклорного (2 млн) и других. Ожидается включение и текстов на латинице, что особенно значимо для изучения исторической эволюции тувинских систем письма.
Проект будет реализован с опорой на Электронный корпус тувинского языка (ЭКТЯ), который был создан в 2016–2017 годах и сегодня доступен в Сети. Сейчас он функционирует как электронная база данных, разработанная для лексического фонда тувинского языка. ЭКТЯ обеспечивает автоматизированный семантический поиск в тувинских текстах.
Еще на
эту тему
Как пришествие корпусов меняет лингвистику
Почему корпусная лингвистика не прижилась в 1960-х годах и почему переживает расцвет сейчас
Владимир Плунгян: «Первый урок корпуса — не злоупотреблять нормализаторством»
Корпус учит лингвистов не доверять своей интуиции и изучать те явления, которые встречаются часто
Роспатент выдал свидетельство о регистрации Национального корпуса удмуртского языка
Пока что в нем около 6 млн словоупотреблений