За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».
...За двадцать лет Национальный корпус русского языка...
...Сегодня есть множество корпусов текстов на русском...
...В России сейчас существует около восьмидесяти корпусов...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...Создание корпусов: проблемы репрезентативности корпусов...
...экстралингвистической разметки, другие аспекты создания корпусов...
...Проблемы использования корпусов для проведения лингвистических...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...К основному набору корпусов добавились многие новые...
...Ряд корпусов предназначен для более узких специалистов...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...может получить доступ к поиску по любому из корпусов...
...Информация из корпусов может быть сложна для восприятия...
...новом интерфейсе информация о структуре и составе корпусов...
Мероприятие, организованное Домом народов России совместно с компанией «Яндекс», соберет ведущих лингвистов, специалистов в области цифровых технологий и представителей государственных организаций для обсуждения цифровой трансформации национальных языков. Ключевые темы: роль искусственного интеллекта в развитии языковых технологий; создание цифровых сервисов для сохранения малых языков; разработка национальных языковых корпусов и переводчиков; цифровизация языков народов России.
...сохранения малых языков; разработка национальных языковых корпусов...
..., встреча с рабочей группой по включению языковых корпусов...
В ХМАО — Югре ведется работа по созданию цифровых корпусов хантыйского и мансийского языков. Об этом сообщает правительство региона по итогам рабочего совещания. Цифровые корпуса представляют собой масштабные текстовые базы данных, предназначенные для изучения и анализа структуры, лексики и грамматики языков коренных народов округа. В рамках государственной программы осуществляется параллельный перевод предложений с русского на мансийский язык, создание аудиозаписей речи, оцифровка ...
...mdash; Югре ведется работа по созданию цифровых корпусов...
...Создание цифровых корпусов позволит расширить присутствие...
Онлайн-журнал «Системный Блокъ» рассказал о масштабных нововведениях в НКРЯ: появились новые корпуса и новые функции.
...Онлайн-журнал «Системный Блокъ» рассказал...
...Один из наиболее значимых новых корпусов — панахронический...
...отличия между материалами блогов и текстами других корпусов...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Появление корпусов этот тип рассуждений подрывает,...
... Появление корпусов производит переворот и в...
...Хотя, надо сказать, появление больших корпусов &mdash...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...касающихся как общей концепции разработки диалектных корпусов...
...Материалы таких корпусов могут использоваться в краеведческих...
Международная научная конференция «Корпусная лингвистика» (SPb Corpora) проводится в Санкт-Петербурге уже в 12-й раз. К участию приглашают аспирантов, кандидатов и докторов наук, работников высших учебных заведений и академических институтов, сотрудников профильных организаций. Заявленные темы конференции: создание корпусов текстов; корпусно-ориентированные исследования; применение нейросетевых технологий в корпусной лингвистике; искусственный интеллект и корпусная лингвистика;
...Заявленные темы конференции: создание корпусов текстов...