Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Точное соответствие
Найдено еще 10 публикаций
Цифровой Чехов: как устроено семантическое издание и где искать 4500 писем Чехова

На примере проекта Chekhov Digital онлайн-журнал «Системный Блокъ» рассказывает о семантическом издании и о том, чем оно полезно.

...Новая технология для гуманитарных исследований...

...На примере проекта Chekhov Digital онлайн-журнал...

...  Подобная разметка произведений Чехова осуществляется с использованием стандарта TEI. Структура каждого документа включает описание библиографических и небиблиографических метаданных....

...Цифровой Чехов: как устроено семантическое издание...

Дневник обновлений: делаем удобнее вид результатов поиска

Команда Грамоты за прошедшую неделю внесла несколько обещанных изменений в работу обновленного портала:  размер поля для вопроса справочной службе увеличился до 1000 символов; добавлена возможность использовать в поисковой строке символы (* и ?), что позволяет искать в текстовых материалах сразу группу похожих слов; для большинства словарей в словарных статьях, которые появляются в результатах поиска, воспроизводится их исходная разметка. Кроме того, мы теперь с ...

...Команда Грамоты последовательно внедряет решения, которые...

..., что позволяет искать в текстовых материалах сразу группу похожих слов; для большинства словарей в словарных статьях, которые появляются в результатах поиска, воспроизводится их исходная разметка....

...Дневник обновлений: делаем удобнее вид результатов...

Кому и зачем нужен Национальный корпус русского языка

Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ —  насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.

...Получить всю картотеку одним кликом и другие, менее...

...Девятнадцать лет назад в России появился электронный...

...Анастасия Козеренко Обычно разметка происходит в несколько этапов: сначала в автоматическом режиме, затем эту разметку дополняют и исправляют разметчики-лингвисты, и только потом тексты поступают к программистам....

...В мультимедийном корпусе есть еще более сложная разметка: например, там вручную маркируются жесты и речевые действия. Для специалистов, которые изучают жесты и связь между словами и жестами, эта информация бесценна....

...В обучающий корпус включены тексты, отобранные специально для школьников, и грамматическая разметка в нем соответствует школьной программе. Это полезный инструмент для работы на уроке и для выполнения домашних заданий....

...Совсем недавно в НКРЯ появилась нейросетевая разметка. Она позволяет, к примеру, проводить подсчеты частоты с учетом омонимии слов: например, как часто встретилось слово пирог в форме пирога́. Его важно не спутать с другим словом, пиро́га, и нейросети умеют различать эти случаи....

...Кому и зачем нужен Национальный корпус русского языка...

В метасловаре пользователь сначала видит общую картину, а потом может вникнуть в детали

Найти слово сразу в нескольких словарях, сравнить результаты, проверить свою версию написания, произношения или толкования — посетители Грамоты всегда охотно пользовались этой возможностью. Но в некоторых случаях детали не нужны, а требуется, наоборот, быстро получить самое общее представление о слове.  Руководитель словарного направления Грамоты Анастасия Александровна Бонч-Осмоловская объясняет, каким образом в метасловаре объединены и структурированы данные о слове и какие преимущества новый формат дает пользователям.

...Поиск по словарям реализован на Грамоте в новом формате...

...Найти слово сразу в нескольких словарях, сравнить результаты...

...Что под капотом: семантическая разметка  В ходе подготовки метасловаря мы проделали невидимую глазу, но очень важную работу по машиночитаемой разметке....

...Семантическая разметка как бы переводит нас из двухмерного мира в трехмерный: помимо «плоского» текста словарных статей, у нас появляется дополнительное изменение, в котором располагаются теги....

...Новые механизмы поиска позволяют давать более адекватные ответы на запросы пользователей, система карточек обеспечивает наглядность и удобство, а машиночитаемая разметка открывает широкие перспективы для сбора статистики и разработки упражнений на разнообразные правила и явления....

...В метасловаре пользователь сначала видит общую картину...

Национальному корпусу русского языка исполняется 20 лет

НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка.  Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...

...Поздравляем наших партнеров и рассказываем об их успехах...

...  А для части корпусов внедрена разметка с применением нейросетей: она позволяет быстро узнавать такие данные, как частотность слова, синтаксические отношения и многое другое....

...Национальному корпусу русского языка исполняется 20...

Произведения из школьной программы и развитие нейросетевой разметки: что нового появилось в НКРЯ

Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...

...Обзор главных изменений за октябрь...

...Национальный корпус русского языка — это огромная...

...Произведения из школьной программы и развитие нейросетевой...

Русский язык в интернете: RU-да или RU-нет?

В конференции участвовали лингвисты, лексикографы, руководители электронных библиотек. Вела конференцию член редакционного совета «Грамоты.ру» Юлия Сафонова.

...Стенограмма конференции о ресурсах в интернете, посвященных...

...В конференции участвовали лингвисты, лексикографы,...

...Владимир Плунгян Что такое разметка? Это на самом деле довольно простая вещь. Это разнообразная информация о языке, которая вносится в корпус специалистами автоматически или вручную, и специальная программа находит интересующие фрагменты текста....

...Первое — главное — это так называемая разметка, такой ключевой термин корпусного дела. И вторая существенная особенность в том, что доступ к целым текстам корпус не дает; тексты, собранные в корпусе, нельзя читать, их можно использовать, получать примеры из них....

...Значит, если мы захотим найти все формы прошедшего времени, разметка дает возможность это сделать, потому что специалисты позаботились о том, чтобы эта информация была. Таким образом все, что нам нужно, мы в корпусе находим, и что можно находить и что нельзя находить, зависит от нас....

...Русский язык в интернете: RU-да или RU-нет?...

Ольга Крючкова: «Работа по сбору и сохранению диалектной речи — это историческая миссия лингвистов»

Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.

...Что волнует русистов сегодня? Опрос Грамоты...

...Наша кафедра теории, истории языка и прикладной лингвистики...

...Диалектный корпус позволяет ставить и решать новые...

...Ольга Крючкова: «Работа по сбору и сохранению диалектной...

От древнерусского до блогов: как изменился Национальный корпус русского языка после редизайна

Онлайн-журнал «Системный Блокъ» рассказал о масштабных нововведениях в НКРЯ: появились новые корпуса и новые функции.

...Теперь искать слово «кот» по лемме можно даже в метро...

...Онлайн-журнал «Системный Блокъ» рассказал...

...Национальный корпус русского языка (НКРЯ) — ключевой...

...От древнерусского до блогов: как изменился Национальный...

Удобный интерфейс для профессионалов и любителей: масштабное обновление НКРЯ

В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...

...Сайт Национального корпуса русского языка теперь сам...

...В 2023 году проект «Национальный корпус русского...

...Удобный интерфейс для профессионалов и любителей: масштабное...