Подсказки для поиска

Нейросеть помогает работать с церковнославянскими рукописями

Нейросеть помогает работать с церковнославянскими рукописями
В коллаже использованы материалы фотобанка Unsplash

Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке. 

До нас дошел очень большой массив рукописей на церковнославянском языке, но у сотрудников библиотек не хватает времени, чтобы оцифровать весь этот огромный материал, что делает его недоступным для исследователей. Новые технологии, прежде всего нейросети, позволяют получить картину бытования и изменения этих текстов, показать, какой вариант текста первичен, в какое время он изменялся в результате редактирования и т. д. 

Распознанные церковнославянские тексты представляют большую ценность для обучения нейросетей, тестирования новых программных средств и методик. Однако пока отсутствует база данных с таким объемом текстов, чтобы к ним можно было применять корпусные методы. Лаборатория цифровой лингвистики МИФИ работает над созданием такой базы совместно с Институтом русского языка им. В. В. Виноградова РАН (Дмитрий Демидов — кандидат технических наук, доцент МИФИ, Александра Плетнева — кандидат филологических наук, ведущий научный сотрудник Научного центра по изучению церковнославянского языка ИРЯ РАН). 

В будущем, вероятно, лингвисты совместно с программистами научат нейросеть различать манеры разных писцов, чтобы решать вопросы палеографии (например, датировку) и определять начертания, которые характерны для конкретных эпох и авторов. Большая сложность заключается в том, что в церковнославянском много надстрочных символов, диакритических знаков. А еще внутри текста бывают особые значки — указания для церковного пения, своего рода язык в языке. Эти символы необходимо сохранить, а чтобы прочесть их, нужны особые методы сегментации. 

Распознанные тексты можно будет превратить в будущем в электронные издания, которые будут интересны не только узким специалистам, но и всем, кто интересуется старыми текстами и хочет посмотреть, как выглядели книги в XII, XVII или XVIII веке. 

Еще на эту тему

Как читать «Сказание о Борисе и Глебе»

Андрей Ранчин — об одном из основополагающих текстов русской духовной культуры

все публикации

Словари всегда отстают от реальной живой речи

На канале «НаучДок» обсудили тренды русского языка

Языковая ситуация в Российской империи: русский и все остальные

У дворян французский, у крестьян русский, а у «инородцев» — свои языки

Главред Грамоты Ксения Киселева: «Мы играем в новые слова!» 

Диалог с Игорем Исаевым о Грамоте и грамотности на канале «Сложное предложение»

Опять об Пушкина! Тест ко дню рождения поэта

Десять вопросов для тех, кто любит «наше всё»

Как генеративный ИИ меняет понятие авторского права

Шутка «тятя, тятя, нейросети пишут лучше Гришковца!» может стать реальностью

Гугол, Пеппи и левидром: детские слова, изменившие мир

Пять историй о том, как полезно бывает прислушаться к ребенку

«Работает она!» Воображаемая аудитория и реплики-перевертыши в диалогах

Лингвист Ирина Левонтина описывает легкий способ обесценить слова собеседника

Сразу после букваря: как Букли помогают ребенку стать читателем

В основе нового проекта издательства «Грамота» лежит принцип ненасильственного чтения

Лингвист Игорь Мельчук о машинном переводе, модели «Смысл — Текст» и науке в СССР

Все пять частей разговора доступны на канале «Глагольная группа»

История с каллиграфией: чем интересна славянская письменность

В XVII веке у каждой буквы было несколько альтернативных форм написания

Из чего приготовлен салат? Тест для тренировки перед ЕГЭ

Чтобы успешно сдать экзамен по русскому языку, важно уметь переключаться между разными темами

Бабай, Лукоморье, свистопляска и другие «нечистые» слова

Сергей Антонов находит следы славянского язычества в современной русской речи

Что можно узнать о грамматике мундари и иврита, решая лингвистические задачи?

При переводе на иврит русское выражение может превратиться в одно слово

Лингвистические лакуны: слова, которых нам очень не хватает

Почему мы не можем сказать «я ихнего борца победю»?

Нишевые нетакуси: а что если все — не такие, как все?

Лингвист Ирина Левонтина рассуждает о выгодных и неприятных сторонах пребывания в нише

«Говорим по-русски!»: три рассказа о церковнославянском языке

Постную Триодь исправили тайно, чтобы избежать нового церковного раскола

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!