Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Нейросеть помогает работать с церковнославянскими рукописями

Нейросеть помогает работать с церковнославянскими рукописями
В коллаже использованы материалы фотобанка Unsplash

Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке. 

До нас дошел очень большой массив рукописей на церковнославянском языке, но у сотрудников библиотек не хватает времени, чтобы оцифровать весь этот огромный материал, что делает его недоступным для исследователей. Новые технологии, прежде всего нейросети, позволяют получить картину бытования и изменения этих текстов, показать, какой вариант текста первичен, в какое время он изменялся в результате редактирования и т. д. 

Распознанные церковнославянские тексты представляют большую ценность для обучения нейросетей, тестирования новых программных средств и методик. Однако пока отсутствует база данных с таким объемом текстов, чтобы к ним можно было применять корпусные методы. Лаборатория цифровой лингвистики МИФИ работает над созданием такой базы совместно с Институтом русского языка им. В. В. Виноградова РАН (Дмитрий Демидов — кандидат технических наук, доцент МИФИ, Александра Плетнева — кандидат филологических наук, ведущий научный сотрудник Научного центра по изучению церковнославянского языка ИРЯ РАН). 

В будущем, вероятно, лингвисты совместно с программистами научат нейросеть различать манеры разных писцов, чтобы решать вопросы палеографии (например, датировку) и определять начертания, которые характерны для конкретных эпох и авторов. Большая сложность заключается в том, что в церковнославянском много надстрочных символов, диакритических знаков. А еще внутри текста бывают особые значки — указания для церковного пения, своего рода язык в языке. Эти символы необходимо сохранить, а чтобы прочесть их, нужны особые методы сегментации. 

Распознанные тексты можно будет превратить в будущем в электронные издания, которые будут интересны не только узким специалистам, но и всем, кто интересуется старыми текстами и хочет посмотреть, как выглядели книги в XII, XVII или XVIII веке. 

Портал «Грамота.ру»

Еще на эту тему

Как читать «Сказание о Борисе и Глебе»

Андрей Ранчин — об одном из основополагающих текстов русской духовной культуры

все публикации

Как победить на олимпиаде по лингвистике

Тренеры российской команды — о том, куда податься школьнику, которому интересно думать о языке


На телеканале ОТР обсуждали засилье иностранных слов

Если убрать из русского языка все заимствования, то от него ничего не останется?


Как вычисление скрытого субъекта помогает понять смысл предложения

Иногда без синтаксического разбора не поймешь, кто на ком стоял


Словесные игры расширяют лексический запас и тренируют навыки коммуникации

А еще они приносят много удовольствия от игрового взаимодействия и помогают лучше узнать друг друга


Как будет выглядеть карта языков России?

Интервью лингвиста Юрия Корякова сайту Русского географического общества


Контактные языки: что бывает, когда соседи не понимают друг друга

Настойчивое желание общаться приводит к появлению конструкций «Моя твоя не понимай»


Чем отличаются по смыслу слова «знакомый», «друг» и «товарищ» в языке Пушкина?

Вышел в свет третий номер «Вестника Московского университета» за 2024 год


Скороговорки: полезное развлечение для детей и взрослых

Как Саша с сушкой и Клара с кларнетом помогают избавиться от каши во рту


Рэп-фристайл: импровизация по-русски в ритме бита

Интервью с руководителем «Фристайл-мастерской» Львом Киселевым


«Говорим по-русски!»: в правилах русской пунктуации есть пробелы

Лингвист Мария Ровинская о том, почему запятые все-таки нужны


«Муж объелся груш» и другие речевые формулы для ответа в рифму

Каждый месяц мы выбираем самые интересные вопросы пользователей и самые полезные ответы нашей справочной службы



Влияние государственных решений на судьбу родных языков

Эксперты обсуждают принятую Концепцию языковой политики и ждут результатов ее реализации




Ошибочные употребления предлогов могут стать частью нормы

Предлоги-захватчики приобретают новые значения, вытесняют другие способы выражения синтаксических связей и вообще много себе позволяют


Вышло новое издание научно-популярной книги Стивена Пинкера «Язык как инстинкт»

Ее можно использовать как пособие по курсу «Введение в языкознание»



Константин Деревянко: «Необходима национальная стратегия развития речевой культуры»

Руководитель Грамоты о том, как владение языком влияет на учебу, карьеру и состояние общества


Откуда берутся и какую функцию выполняют бранные слова

Ругательства — нормальная часть языка, хотя не все они относятся к литературной норме


Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!