Подсказки для поиска

Семантические издания Толстого, Пушкина и Чехова — новый способ существования литературных текстов

Семантические издания Толстого, Пушкина и Чехова — новый способ существования литературных текстов
В коллаже использованы материалы фотобанка Pexels и pushkin-digital

Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.

«Семантическое издание — это представление текста в виде связанных данных. Для этого текст должен быть размечен, то есть его элементам приписана информация об их значении в виде организованных меток в машиночитаемом формате. Притом формат должен быть универсальным: то есть для разметки одних и тех же сущностей в разных текстах должны использоваться одни и те же метки»1.

В основе проекта Слово Толстого — электронная версия девяностотомного собрания сочинений Льва Толстого. Запуск проекта состоялся осенью 2022 года и стал результатом многолетней работы группы Tolstoy Digital под руководством Феклы Толстой, в которой участвовали Государственный музей Л. Н. Толстого, НИУ ВШЭ и компания ABBYY. Пользователю доступен поиск по корпусу текстов, а также многочисленные словарные и справочные материалы. В дальнейшем база будет пополнена книгами из личной библиотеки Толстого, письмами и дневниками самого писателя и членов его семьи и работами исследователей. 

Семантическое издание полного собрания сочинений Чехова Chekhov Digital разрабатывает Южный федеральный университет совместно с Центром гуманитарных исследований НИУ ВШЭ. Ресурс позволяет использовать как обычный поиск по слову или фразе, так и расширенный — по году, тому, изданию, месту написания, по жанру или объему произведения и другим параметрам. Можно искать фрагменты текста по именам персонажей, по названиям животных или природным явлениям. 

Проект Pushkin Digital основан на материалах академического полного собрания сочинений Пушкина, которые подготовлены в Пушкинском Доме — ИРЛИ РАН. Здесь вместо тегирования информации фокус сделан на комментировании и создании гипертекстуальности. Помимо обширного историко-литературного комментария доступно большое количество внешних ссылок, книг и статей, а также аудио- и видеоматериалов. Оцифрованы десятки рукописей, к ним дается специальная расшифровка, благодаря чему можно проследить ход работы писателя. В отдельном каталоге собраны иллюстрации художников к произведениям Пушкина. 

Семантические издания полезны как для профессионалов, так и для всех, кто интересуется русской литературой, поэтому таких проектов будет становиться все больше. Например, обсуждаются перспективы объединения усилий для создания цифрового Достоевского.  Подробнее о разнообразных проектах в этой области можно прочитать на портале «Горький».

Портал «Грамота.ру»

Еще на эту тему

Современные онлайн-ресурсы расширяют возможности исследователей русского языка

Инструменты, разработанные сотрудниками ИЛИ РАН, будут интересны и неспециалистам

Как цифровизация помогает сохранить языки коренных народов России

Голосовые помощники, цифровые учебники и онлайн-переводчики вносят вклад в создание языковой среды

все публикации

Лингвист Игорь Мельчук вспоминает о жизни и науке середины XX века

Ведущие подкаста «Глагольная группа» анонсировали серию разговоров со знаменитым ученым

Слоп: низкокачественный ИИ-контент

Меткое слово со множеством значений — от «бракованного товара» до «помоев»

Федор Успенский: «Меня раздражает, когда привычные вещи, на которых я вырос, начинают меняться»

Как меняется русский язык? Лингвисты по просьбе Грамоты рассказывают о главных трендах

Ред-флаг: предупреждение об опасности

Тревожные звоночки еще можно игнорировать, а от красных флагов лучше сразу бежать

Пупупу: новое междометие

Реакция на негатив, задумчивость и принятие неизбежного

Промпт: запрос к языковой модели

С новыми технологиями в нашем активном лексиконе появляются и новые слова

Топонимические легенды предлагают яркие истории вместо этимологии

Откуда куропатки на гербе Курска и кто стрелял из лука в Великих Луках?

Подсветить: смысловое выделение

Модный глагол позволяет расставлять нужные акценты и влиять на восприятие информации

Лимб: зависнуть в неопределенности

Слово с богословскими корнями стало обозначать подвешенное состояние

Русские отчества: как вас по батюшке?

Исторически Иванов и Иванович — одно и то же

Выгорание: остался только пепел

Как редкое слово с техническим смыслом стало популярным обозначением последствий стресса

Галина Кустова: «Есть участки, где грамматика развивается быстро и даже стремительно!»

Как меняется русский язык? Лингвисты по просьбе Грамоты рассказывают о главных трендах

Имба: крутизна, которой нет равных

Как жалоба на дисбаланс превратилась в похвалу

Зумер: непонятная молодежь

Слово, которое полюбили социологи, маркетологи и рекрутеры

Брейнрот: контент, разлагающий мозг

Может ли потребление некачественного контента приводить к снижению когнитивных способностей?

Между 6 и 7: какую функцию выполняет числовой сленг

Социолингвист Валерий Шульгинов показывает на примерах, что мы можем сказать с помощью чисел

В какой вы сейчас эре?

Ирина Левонтина выясняет, как соотносится исторический масштаб с человеческой жизнью и при чем тут Тейлор Свифт

Павел Басинский: «Язык умнее нас»

Как меняется русский язык? Филологи по просьбе Грамоты рассказывают о главных трендах

Как словарные пометы помогают лучше узнать «характер» слова

Разговорное или просторечное? Книжное или высокое?

Чем сгенерированные тексты (пока еще) выдают себя

От шаблонной лексики до «любимых» синтаксических конструкций

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!