Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Но это не единственный урок корпуса....
...П.: Если смотреть на язык из корпуса, то язык исчезает...
...Но если посмотреть со стороны корпуса, то это очень...
В ХМАО — Югре ведется работа по созданию цифровых корпусов хантыйского и мансийского языков. Об этом сообщает правительство региона по итогам рабочего совещания. Цифровые корпуса представляют собой масштабные текстовые базы данных, предназначенные для изучения и анализа структуры, лексики и грамматики языков коренных народов округа. В рамках государственной программы осуществляется параллельный перевод предложений с русского на мансийский язык, создание аудиозаписей речи, оцифровка ...
...Цифровые корпуса представляют собой масштабные текстовые...
...Презентация готового корпуса мансийского языка запланирована...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
... Объем Корпуса на данный момент составляет порядка...
...Сейчас, по словам авторов, продолжается формирование корпуса...
...удмуртского литературного языка, а также разработка корпуса...
О начале работы над корпусом объявили участники круглого стола, прошедшего в Тувинском институте гуманитарных и прикладных социально-экономических исследований (ТИГПИ) 22 июня. Круглый стол был посвящен 95-летию тувинской письменности и проводился в рамках Международного десятилетия языков коренных народов под эгидой ЮНЕСКО. Новый корпус будет насчитывать более 20 млн словоупотреблений, в том числе из газетного корпуса (около 10 млн), параллельного ...
...словоупотреблений, в том числе из газетного корпуса...
...(около 10 млн), параллельного корпуса (5 ...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...мемориальная секция будет посвящена истории создания корпуса...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Много ли сейчас пользователей у корпуса &...
...Лингвисты когда-то создавали корпуса только для себя...
..., поэтического корпуса и многих других....
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...отображается подробная информация о запросе в шапке корпуса...
...В шапке корпуса отображается не только информация ...
...карт и графиков в интерфейсе «Портрет корпуса...
29–31 октября состоится цикл бесплатных онлайн-вебинаров, посвященных использованию Национального корпуса русского языка (НКРЯ) в школьном преподавании. Программа включает три тематических блока. Первый вебинар познакомит с возможностями НКРЯ: участники узнают, какие корпусы подходят для школы и как работать с системой поиска. Второй посвятят созданию собственных упражнений на основе примеров из корпуса. На третьем расскажут, как организовать ...
...онлайн-вебинаров, посвященных использованию Национального корпуса...
...собственных упражнений на основе примеров из корпуса...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
... Разработкой корпуса занимается большая команда...
...Например, преподаватели могут с использованием Корпуса...
...Следить за новостями Корпуса можно в телеграм-канале...
За прошедшие два десятилетия НКРЯ стал незаменимым инструментом для лингвистов, преподавателей, студентов и всех, кто интересуется русским языком. Усилия команды специалистов в области языка, а также разработчиков цифровой платформы НКРЯ позволили собрать обширную базу данных, отражающую богатство и разнообразие русского языка. На сайте корпуса постоянно публикуется информация о пополнении старых частей корпуса, о создании новых корпусов внутри НКРЯ и о
...На сайте корпуса постоянно публикуется информация о...
... пополнении старых частей корпуса, о создании...
...Желаем дружественной команде Национального корпуса...