Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Цифровой Чехов: как устроено семантическое издание и где искать 4500 писем Чехова

На примере проекта Chekhov Digital онлайн-журнал «Системный Блокъ» рассказывает о семантическом издании и о том, чем оно полезно.

Проект Chekhov Digital посвящен изучению литературного наследия Чехова. Семантическое издание — это цифровая форма текстов, снабженных структурно-семантической разметкой, что позволяет проводить интеллектуальный анализ и систематизацию внутритекстовых компонентов. 

Подобная разметка произведений Чехова осуществляется с использованием стандарта TEI. Структура каждого документа включает описание библиографических и небиблиографических метаданных. Корпус таких TEI-документов представляет труды писателя в виде единой семантической сети, которую можно использовать для последующего компьютерного анализа и надстройки интерактивной поисковой системы. Проект Chekhov Digital помогает исследователям изучать социальные связи Чехова и его обширную переписку — 4500 писем, написанных в 1875–1904 годах. 

Часть сущностей локальной базы знаний Chekhov Digital автоматически связывается с внешней базой знаний «Викиданные», благодаря чему можно исследовать пересечения социальных сетей разных авторов. В рамках проекта также разрабатывается семантическое издание текстов Льва Толстого.

Портал «Грамота.ру»

Еще на эту тему

Подкаст «Что это значит?» проясняет смысл необычных современных слов

Даже если вы избегаете новых заимствований, полезно понимать, откуда взялись ретрит, косты и непо-бейбис

В Москве прошла первая стратегическая сессия «Информационные технологии и языки народов России»

Мероприятие организовано Домом народов России при поддержке ФАДН России

В Метасловаре Грамоты появилась возможность проверять ударения при подготовке к ЕГЭ по русскому языку

Все слова, вошедшие в орфоэпический словник, отмечены специальной плашкой

Как относиться к русскому мату? Мария Ровинская в подкасте «Кот Шредингера»

О табу и правилах безопасности при использовании сильных языковых средств

все публикации

Подкаст «Что это значит?» проясняет смысл необычных современных слов

Даже если вы избегаете новых заимствований, полезно понимать, откуда взялись ретрит, косты и непо-бейбис


Функции и характерные черты публицистического стиля речи

Он предназначен для СМИ, выступлений и публицистической литературы


Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Михаил Копотев о роли сгенерированных нейросетью текстов в развитии моделей и в жизни людей


В Москве прошла первая стратегическая сессия «Информационные технологии и языки народов России»

Мероприятие организовано Домом народов России при поддержке ФАДН России


Русский язык как государственный: что означает этот статус

Когда средство общения становится символом страны и национальным достоянием



Два брата и два алфавита: история изобретения славянской письменности

Кирилл и Мефодий вместе с учениками придумали не только буквы, но и язык




Как относиться к русскому мату? Мария Ровинская в подкасте «Кот Шредингера»

О табу и правилах безопасности при использовании сильных языковых средств


Чтобы хорошо учиться, детям нужно больше слов

Исследователи рекомендуют увеличивать словарный запас детей тремя способами


Чтение: практика, меняющая сознание

Пять книг о том, зачем мы читаем и как получить от этого занятия пользу и удовольствие


Вышел первый выпуск журнала «Русская речь» за 2024 год

«Фреш», «бишь» и научная терминология до Ломоносова 


Зоолог Арик Кершенбаум: «Мы все хотим знать, что говорят животные»

Интервью с автором новой книги о коммуникации в дикой природе


Чем нас привлекают искусственные языки

Их создание и изучение помогает лучше понять границы естественного языка


Вышла в свет книга археолога Стивена Митена «Загадка языка»

В ней утверждается, что язык возник примерно 1,6 млн лет назад


Право на имя

Когда выбор способа называть человека или группу людей становится проблемой


Между эмбрионом и покойником: где расположены роботы на шкале одушевленности

Каждый месяц мы выбираем и комментируем три вопроса, на которые ответила наша справочная служба


Как пришествие корпусов меняет лингвистику

Почему корпусная лингвистика не прижилась в 1960-х годах и почему переживает расцвет сейчас


Эвфемизмы: от суеверий до политкорректности

«Благозвучные» слова используют не только вместо ругательств