Подсказки для поиска

От древнерусского до блогов: как изменился Национальный корпус русского языка после редизайна

Онлайн-журнал «Системный Блокъ» рассказал о масштабных нововведениях в НКРЯ: появились новые корпуса и новые функции.

Национальный корпус русского языка (НКРЯ) — ключевой инструмент для исследователей русского языка, литературы и словесной культуры. В 2019 году возникли опасения по поводу возможного закрытия сервиса, однако он не только продолжил свою работу, но и значительно расширился. Обновления включают как новый дизайн сайта, так и содержательные изменения.

Один из наиболее значимых новых корпусов — панахронический, который объединяет тексты разных исторических периодов (начиная со Средневековья и заканчивая современностью). Он позволяет исследователям формулировать запросы, охватывающие несколько веков развития русского языка. Унифицированные грамматические признаки облегчают поиск по различным формам слова. 

Новый корпус «Русская классика» включает в себя собрание сочинений русских авторов, в том числе разные редакции и даже черновики произведений. Кроме того, создан корпус детской литературы «От 2 до 15». Каждое произведение размечено по возрастам при помощи нейросетей. В корпус вошли 75 популярных произведений зарубежных и отечественных авторов.

Еще один интересный корпус — коллекция записей из блогов и социальных сетей. Он позволяет исследовать диалоговую природу текстов и выявить отличия между материалами блогов и текстами других корпусов. 

Нейросетевая программа «РуБик» отвечает за автоматическое снятие омонимии, что улучшило качество морфологической разметки. Добавление функции поиска коллокаций позволяет выявлять слова, которые часто встречаются вместе с заданными словами. Также появилась функция отображения частотности употребления слов и словосочетаний в выдаче. 

Эти и другие нововведения значительно расширяют возможности НКРЯ, делая его более удобным и функциональным инструментом для исследователей русского языка и текстовой культуры.

Портал «Грамота.ру»

Еще на эту тему

В среднем человек ругается 250 тысяч раз за жизнь — как к этому относиться?

Константин Деревянко, Ярослав Скворцов и Владимир Легойда обсудили ненормативную лексику

Лингвист Алексей Шмелев: «У слова „столько“ есть полная парадигма единственного числа»

«Правмир» поговорил о русском языке и лингвистике с председателем Орфографической комиссии РАН

Евгений Головко о связи лингвистики с науками о человеке и обществе

Для антропологической лингвистики язык — прежде всего культурный маркер

ИИ отбирает у человека языковое пространство?

О некоторых публикациях журнала «Русская речь» за 2025 год

К 90-летию со дня рождения Андрея Анатольевича Зализняка

Книги, лекции, выступления, воспоминания

все публикации

В среднем человек ругается 250 тысяч раз за жизнь — как к этому относиться?

Константин Деревянко, Ярослав Скворцов и Владимир Легойда обсудили ненормативную лексику

Тест: знаете ли вы значение этих устаревших слов?

Увраж, палаш, ажитация и еще семь слов, которые мы больше не используем

Я вижу, значит, я понимаю: как устроены метафоры восприятия

Лингвист Валерий Шульгинов о мыслях в животе, текучем времени и связи слуха с послушанием

Страсти вокруг нормы

Светлана Друговейко-Должанская о том, почему кодификация языковых явлений не может строиться на личных предпочтениях

Лингвист Алексей Шмелев: «У слова „столько“ есть полная парадигма единственного числа»

«Правмир» поговорил о русском языке и лингвистике с председателем Орфографической комиссии РАН

Практическое руководство по использованию эмодзи: как избежать конфуза

Результаты нашего опроса и маленький словарик в помощь сомневающимся

«Дорогие дети! Я в вас верю, всё будет в порядке!»

Психолог Елена Морозова о том, как пережить ЕГЭ

Что такое бывшие диминутивы и как они возникают

Зяблик, ласточка, букашка потеряли связь со своими «родителями» и стали самостоятельными словами

Николай Карамзин, сентименталист-революционер

Рассказываем о ключевых исторических фигурах, повлиявших на развитие русского письменного языка

Что в эмодзи тебе моем: как смайлы помогают и мешают нам общаться

Улыбка в рабочей переписке может оскорбить, а пицца в описании профиля — напугать

Термины родства и свойства́ в русском языке

В День семьи разбираемся, чьим мужем может быть зять и от кого нужно скрываться невестке

Евгений Головко о связи лингвистики с науками о человеке и обществе

Для антропологической лингвистики язык — прежде всего культурный маркер

Тест на общие корни: найдите дальних родственников!

Чтобы увидеть этимологические связи между русскими словами, приходится вспоминать латынь и греческий

Яков Грот, систематизатор русской орфографии

Рассказываем о ключевых исторических фигурах, повлиявших на развитие русского письменного языка

Какие фамилии в русском языке не склоняются?

На склонение фамилии влияет не только пол ее носителя

Почему так трудно выбрать номинацию для людей с инвалидностью?

Ни прямота, ни политкорректность сами по себе не решают проблемы

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!