Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Но это не единственный урок корпуса....
...П.: Если смотреть на язык из корпуса, то язык исчезает...
...Но если посмотреть со стороны корпуса, то это очень...
В ХМАО — Югре ведется работа по созданию цифровых корпусов хантыйского и мансийского языков. Об этом сообщает правительство региона по итогам рабочего совещания. Цифровые корпуса представляют собой масштабные текстовые базы данных, предназначенные для изучения и анализа структуры, лексики и грамматики языков коренных народов округа. В рамках государственной программы осуществляется параллельный перевод предложений с русского на мансийский язык, создание аудиозаписей речи, оцифровка ...
...Цифровые корпуса представляют собой масштабные текстовые...
...Презентация готового корпуса мансийского языка запланирована...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
... Объем Корпуса на данный момент составляет порядка...
...Сейчас, по словам авторов, продолжается формирование корпуса...
...удмуртского литературного языка, а также разработка корпуса...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Много ли сейчас пользователей у корпуса &...
...Лингвисты когда-то создавали корпуса только для себя...
..., поэтического корпуса и многих других....
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...В.: У корпуса есть продуктовый комитет, который решает...
...Материалы для основного корпуса были подобраны так,...
...Все корпуса снабжены морфологической разметкой, то...
О начале работы над корпусом объявили участники круглого стола, прошедшего в Тувинском институте гуманитарных и прикладных социально-экономических исследований (ТИГПИ) 22 июня. Круглый стол был посвящен 95-летию тувинской письменности и проводился в рамках Международного десятилетия языков коренных народов под эгидой ЮНЕСКО. Новый корпус будет насчитывать более 20 млн словоупотреблений, в том числе из газетного корпуса (около 10 млн), параллельного ...
...словоупотреблений, в том числе из газетного корпуса...
...(около 10 млн), параллельного корпуса (5 ...
29–31 октября состоится цикл бесплатных онлайн-вебинаров, посвященных использованию Национального корпуса русского языка (НКРЯ) в школьном преподавании. Программа включает три тематических блока. Первый вебинар познакомит с возможностями НКРЯ: участники узнают, какие корпусы подходят для школы и как работать с системой поиска. Второй посвятят созданию собственных упражнений на основе примеров из корпуса. На третьем расскажут, как организовать ...
...онлайн-вебинаров, посвященных использованию Национального корпуса...
...собственных упражнений на основе примеров из корпуса...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...отображается подробная информация о запросе в шапке корпуса...
...В шапке корпуса отображается не только информация ...
...карт и графиков в интерфейсе «Портрет корпуса...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
... Разработкой корпуса занимается большая команда...
...Например, преподаватели могут с использованием Корпуса...
...Следить за новостями Корпуса можно в телеграм-канале...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Добавились два новых корпуса: «Русская классика...
...Подробнее о новостях Национального корпуса русского...