Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...В дальнейшем предполагается создание корпусов диалектных...
Международный пятидневный форум для преподавателей русского языка стран Северной Африки и Ближнего Востока Terra Rusistica открылся в Тунисе 15 апреля. Организаторами выступают Международная ассоциация преподавателей русского языка и литературы (МАПРЯЛ), Тунисская ассоциация преподавателей русского языка и литературы, кафедра восточных языков Высшего института языков Карфагенского университета и Русский дом в Тунисе. Это одно из самых масштабных мероприятий ...
...проведет мастер-класс по вопросам применения языковых корпусов...
За прошедшие два десятилетия НКРЯ стал незаменимым инструментом для лингвистов, преподавателей, студентов и всех, кто интересуется русским языком. Усилия команды специалистов в области языка, а также разработчиков цифровой платформы НКРЯ позволили собрать обширную базу данных, отражающую богатство и разнообразие русского языка. На сайте корпуса постоянно публикуется информация о пополнении старых частей корпуса, о создании новых корпусов внутри НКРЯ и о
...пополнении старых частей корпуса, о создании новых корпусов...
27 июня в международном мультимедийном пресс-центре «Россия сегодня» состоялась пресс-конференция Института русского языка Российского университета дружбы народов. Об уникальных образовательных программах бакалавриата «Прикладная цифровая филология» и магистратуры «Цифровые инновации в филологии» рассказали участники пресс-конференции: — директор Института русского языка РУДН, член Совета при Президенте Российской Федерации по русскому ...
...сетей, создание цифровых текстов и лингвистических корпусов...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...существовал серьезный дефицит цифровых ресурсов и корпусов...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Еще девять из уже имеющихся корпусов были пополнены...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
... А для части корпусов внедрена разметка...
В декабре 2025 года в Якутске был представлен программно-аппаратный комплекс «АйУол» (AiUol). По заявлениям создателей, это первая умная колонка, спроектированная специально для понимания якутской речи. В названии содержится языковая игра. «Ай» на якутском означает «творящий», а также международное обозначение искусственного интеллекта (AI); «Уол» — «юноша», «сын». Колонка ...
...Ведутся проекты по сбору голосовых корпусов для...
Институт Пушкина, Институт русского языка им. В. В. Виноградова РАН, кафедра русского языка Томского государственного университета и Международная лаборатория языковой конвергенции НИУ ВШЭ проводят уже второй международный симпозиум, посвященный лексикографии в условиях цифровой эпохи. Симпозиум пройдет под эгидой Комиссии по лексикологии и лексикографии Международного комитета славистов и Российского общества преподавателей русского языка и литературы ...
...лексикографических баз, словарных и текстовых корпусов...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...НКРЯ — это 49 корпусов, в том...