Портрет слова, корпус соцсетей и поиск коллокаций: что нового появилось в НКРЯ
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год.
- Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и семантические характеристики, частотность (как часто слово встречается в данном корпусе), формы слова, похожие на него по смыслу, и однокоренные с ним слова, примеры употребления, график, показывающий количество употреблений слова по годам.
- Добавились два новых корпуса: «Русская классика» и «Социальные сети». В первом можно найти тексты авторов XIX и начала XX века: Пушкина, Льва Толстого, Достоевского, Чехова и других. Корпус позволяет изучать язык и стиль этих авторов, а также исследовать, как их произведения повлияли на развитие русской литературы. В корпусе «Социальные сети» собраны тексты из популярных соцсетей, таких как «ВКонтакте», Telegram, Livejournal, Liveinternet, Blogspot. Он позволяет изучать, как люди общаются в социальных сетях, какие темы они обсуждают и какие слова используют. Еще девять из уже имеющихся корпусов были пополнены новыми текстами.
- Появился новый вид поиска. Искать теперь можно не только точные вхождения слова или фиксированного выражения (например, честь имею) и не только слова с определенными лексико-грамматическими характеристиками на определенном расстоянии друг от друга, но и коллокации. Это устойчивые словосочетания, которые часто встречаются в текстах и состоят из двух компонентов: ключа и коллоката. Искать коллокации можно с указанием синтаксической связи. Например, если в графе «ключ» написать слово решение, а для коллоката указать часть речи «глагол», синтаксическую связь «дополнение» и направление связи «управляет», поиск выдаст, что именно чаще всего делают с решением: принимают, одобряют, согласовывают и т. д. Чтобы увидеть пример для каждой коллокации, нужно кликнуть на слово «пример» в таблице.
Подробнее о новостях Национального корпуса русского языка можно узнать в телеграм-канале проекта.
Еще на
эту тему
Кому и зачем нужен Национальный корпус русского языка
Получить всю картотеку одним кликом и другие, менее очевидные возможности специальных корпусов
Анна Павлова: «Фразеологизмы-конструкции частотны в устной речи, но их трудно найти в корпусах»
Что волнует русистов сегодня? Опрос Грамоты
От древнерусского до блогов: как изменился Национальный корпус русского языка после редизайна
Теперь искать слово «кот» по лемме можно даже в метро