Подсказки для поиска

Национальному корпусу русского языка исполняется 20 лет

НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. 

Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно добавляются новые корпусы.

Также НКРЯ — цифровой проект с удобным интерфейсом. Все тексты снабжены лингвистической разметкой и инструментами поиска: это позволяет формулировать сложные поисковые запросы и с их помощью находить примеры употребления слов и словосочетаний. 

А для части корпусов внедрена разметка с применением нейросетей: она позволяет быстро узнавать такие данные, как частотность слова, синтаксические отношения и многое другое.

Корпус может быть полезен и лингвистам, и преподавателям русского языка, и другим пользователям для разных нужд. Например, преподаватели могут с использованием Корпуса составлять задания, лингвисты — значительно упростить и ускорить проведение исследований, а писатели, журналисты, блогеры и просто интересующиеся языком — узнать, когда, по данным Корпуса, слово было впервые зафиксировано; в каких контекстах обычно употребляется то или иное выражение; какие есть нетривиальные рифмы к слову любовь и как часто употреблялось определенное слово в разные исторические периоды.

Кому и зачем нужен Национальный корпус русского языкаПолучить всю картотеку одним кликом и другие, менее очевидные возможности специальных корпусовСовокупные ресурсы и инструменты Национального корпуса русского языка, цифровой экосистемы «Грамота» и будущего Национального словарного фонда смогут покрыть все потребности пользователей в информации о русском языке, обеспечить его сохранение и популяризацию, позволят лингвистам изучать язык, а всем остальным — наиболее эффективно учиться языку.

Поздравляем коллег с юбилеем и желаем развития и процветания!

Следить за новостями Корпуса можно в телеграм-канале и на сайте проекта.

Портал «Грамота.ру»

Еще на эту тему

Удобный интерфейс для профессионалов и любителей: масштабное обновление НКРЯ

Сайт Национального корпуса русского языка теперь сам адаптируется под нужды пользователей

Владимир Плунгян: «Первый урок корпуса — не злоупотреблять нормализаторством»

Корпус учит лингвистов не доверять своей интуиции и изучать те явления, которые встречаются часто

все публикации

Таджики, негры и евреи: что исследует лингвистическая конфликтология

Сотрудники НИУ ВШЭ рассказали коллегам об этом научном направлении и о результатах своих экспериментов

Как склонять по-русски составные топонимы

В зависимости от происхождения и структуры могут склоняться обе части названия, одна из частей или ни одной

Слова-паразиты: откуда они берутся и какую роль выполняют

Они приходят без разрешения и «питаются» смыслом высказывания

«Набросал стишата», или О стратегии авторской скромности

Мое творчество, мои произведения... Ирина Фуфаева объясняет, почему нас смущают эти выражения

Кринж или не кринж? Лингвистический взгляд на чувство неловкости в коммуникации

Валерий Шульгинов пытается понять, какие ситуации мы описываем этим словом и почему

В Ухане или в Ухани? Как выяснить тип склонения иностранного топонима

Первый шаг — определить, насколько это название привычное и есть ли похожие на него русские слова

Как редакционная политика повышает качество текстов

Что в ней должно быть и кто заинтересован в том, чтобы она работала

Слово «пожалуйста» может быть избыточным

Представляем некоторые публикации в третьем номере журнала «Русская речь» за 2025 год

Свое среди чужих: попробуйте отличить исконно русское слово от заимствований

Десять примеров того, что разница между «местными» и «чужаками» со временем перестает быть заметной

Стенография: как поймать слова на лету

От мраморных плит до современных программ

Чем опасны «бесы орфографии»?

Не надо искать в приставке нечистую силу и злой умысел

Язык всегда найдет способ заполнить лакуны

Лингвист Мария Ровинская дала интервью каналу «Мослекторий»

Александр Пушкин, главный инфлюенсер русского языка

Его влияние на то, как мы говорим и пишем, сохраняется спустя двести лет

В среднем человек ругается 250 тысяч раз за жизнь — как к этому относиться?

Константин Деревянко, Ярослав Скворцов и Владимир Легойда обсудили ненормативную лексику

Тест: знаете ли вы значение этих устаревших слов?

Увраж, палаш, ажитация и еще семь слов, которые мы больше не используем

Я вижу, значит, я понимаю: как устроены метафоры восприятия

Лингвист Валерий Шульгинов о мыслях в животе, текучем времени и связи слуха с послушанием

Страсти вокруг нормы

Светлана Друговейко-Должанская о том, почему кодификация языковых явлений не может строиться на личных предпочтениях

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!