Подсказки для поиска

Произведения из школьной программы и развитие нейросетевой разметки: что нового появилось в НКРЯ

Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года.

  • Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного чтения.
  • Разработчики использовали нейросетевые модели для морфологической разметки всех текстов обучающего корпуса. Программа распознаёт и снимает грамматическую омонимию (когда словоформы разных слов совпадают друг с другом по написанию и звучанию — например, лечу больного и лечу на самолете). Это позволило добавить в обучающий корпус современные инструменты анализа слов и текстов.
  • При помощи новых инструментов можно составлять более разнообразные задания для школьников. Ученики смогут использовать их и для самостоятельной работы — например, чтобы написать реферат. А для преподавателей и студентов, готовых проводить более сложные исследования, добавлены новые виды выдачи результатов поиска (статистика, частотность, N-граммы) и новый вид поиска — поиск коллокаций. 

Кому и зачем нужен Национальный корпус русского языкаПолучить всю картотеку одним кликом и другие, менее очевидные возможности специальных корпусов

  • Мультимедийный корпус переведен на новый интерфейс. Теперь поиск по корпусу отображается в новом дизайне, доступны «Портреты слов». Особенность корпуса в том, что можно задать одновременно три поисковых запроса: для слов, жестов и речевых действий. По ним найдутся клипотексты, где и в видео/аудио, и в тексте встретились соответствия этим запросам: например, те, где в речи есть слово за, а в значении жеста — тост. Дополнительно можно задавать условия, описывающие вокалическую и орфоэпическую структуру слов.

Подробнее о новостях Национального корпуса русского языка можно узнать в телеграм-канале проекта. 

Портал «Грамота.ру»

все публикации

Запретные слова: что думают лингвисты о нецензурной лексике как части русского языка

В издательстве МИФ вышла научно-популярная книга двух докторов филологических наук

«Слова года» полгода спустя: кто продолжает забег

Насколько точным был прошлогодний выбор Грамоты и как чувствуют себя «наши» неологизмы сегодня

Как устроены языковые манипуляции

Эти приемы используют публицисты, политики, телефонные мошенники и даже родственники

Что значит это региональное слово?

Не только «поребрик» и «мультифора» выдают малую родину говорящего

Высок как гора, застенчив как барышня: что фразеология сообщает о культурно-языковой картине мире

Лингвокультуролог Мария Ковшова о разных способах символизации реальности

Таджики, негры и евреи: что исследует лингвистическая конфликтология

Сотрудники НИУ ВШЭ рассказали коллегам об этом научном направлении и о результатах своих экспериментов

Как склонять по-русски составные топонимы

В зависимости от происхождения и структуры могут склоняться обе части названия, одна из частей или ни одной

Слова-паразиты: откуда они берутся и какую роль выполняют

Они приходят без разрешения и «питаются» смыслом высказывания

«Набросал стишата», или О стратегии авторской скромности

Мое творчество, мои произведения... Ирина Фуфаева объясняет, почему нас смущают эти выражения

Кринж или не кринж? Лингвистический взгляд на чувство неловкости в коммуникации

Валерий Шульгинов пытается понять, какие ситуации мы описываем этим словом и почему

В Ухане или в Ухани? Как выяснить тип склонения иностранного топонима

Первый шаг — определить, насколько это название привычное и есть ли похожие на него русские слова

Как редакционная политика повышает качество текстов

Что в ней должно быть и кто заинтересован в том, чтобы она работала

Слово «пожалуйста» может быть избыточным

Представляем некоторые публикации в третьем номере журнала «Русская речь» за 2025 год

Свое среди чужих: попробуйте отличить исконно русское слово от заимствований

Десять примеров того, что разница между «местными» и «чужаками» со временем перестает быть заметной

Стенография: как поймать слова на лету

От мраморных плит до современных программ

Чем опасны «бесы орфографии»?

Не надо искать в приставке нечистую силу и злой умысел

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!