Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Нейросеть помогает работать с церковнославянскими рукописями

Нейросеть помогает работать с церковнославянскими рукописями
В коллаже использованы материалы фотобанка Unsplash

Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке. 

До нас дошел очень большой массив рукописей на церковнославянском языке, но у сотрудников библиотек не хватает времени, чтобы оцифровать весь этот огромный материал, что делает его недоступным для исследователей. Новые технологии, прежде всего нейросети, позволяют получить картину бытования и изменения этих текстов, показать, какой вариант текста первичен, в какое время он изменялся в результате редактирования и т. д. 

Распознанные церковнославянские тексты представляют большую ценность для обучения нейросетей, тестирования новых программных средств и методик. Однако пока отсутствует база данных с таким объемом текстов, чтобы к ним можно было применять корпусные методы. Лаборатория цифровой лингвистики МИФИ работает над созданием такой базы совместно с Институтом русского языка им. В. В. Виноградова РАН (Дмитрий Демидов — кандидат технических наук, доцент МИФИ, Александра Плетнева — кандидат филологических наук, ведущий научный сотрудник Научного центра по изучению церковнославянского языка ИРЯ РАН). 

В будущем, вероятно, лингвисты совместно с программистами научат нейросеть различать манеры разных писцов, чтобы решать вопросы палеографии (например, датировку) и определять начертания, которые характерны для конкретных эпох и авторов. Большая сложность заключается в том, что в церковнославянском много надстрочных символов, диакритических знаков. А еще внутри текста бывают особые значки — указания для церковного пения, своего рода язык в языке. Эти символы необходимо сохранить, а чтобы прочесть их, нужны особые методы сегментации. 

Распознанные тексты можно будет превратить в будущем в электронные издания, которые будут интересны не только узким специалистам, но и всем, кто интересуется старыми текстами и хочет посмотреть, как выглядели книги в XII, XVII или XVIII веке. 

Портал «Грамота.ру»

Еще на эту тему

Как читать «Сказание о Борисе и Глебе»

Андрей Ранчин — об одном из основополагающих текстов русской духовной культуры

все публикации

Что такое старомосковское произношение

Говор стал престижным в тот момент, когда начал устаревать



«Не лучше ли было хоть немного прояснить фразу?» Переиздана книга Норы Галь

«Слово живое и мертвое» об искусстве перевода и редакторском мастерстве не теряет актуальности


Какую роль играет языковой акцент в жизни и работе

Несоблюдение фонетических норм — барьер для общения и карьеры или проявление индивидуальности?



Архаичные союзы «ибо» и «дабы» употребляются в современной разговорной речи

Они то уходили на периферию русского языка, то снова обретали популярность



Официально-деловой стиль: язык бюрократии

Мы гуляли по лесному массиву и посетили данное заведение…


Как изменилось преподавание литературы в школе

От гуманистических подходов — к увлечению цифровыми технологиями


Скрытые заимствования: иногда новые слова и смыслы появляются по аналогии

Мария Елиферова приводит случаи калькирования, о которых мы даже не догадываемся


Новый учебник «Русский язык и культура речи» подготовлен в МГУ

Он рассчитан на студентов и преподавателей негуманитарных вузов



Орфографические словари: как не ошибиться в написании слова

Они особенно необходимы языкам с древней письменностью


Профессиональные жаргоны: зачем говорить не как все?

Социолекты юристов, медиков и разработчиков отличаются лексически, но у них есть и общие черты


Деревенский говор интереснее стандартного литературного языка

Лингвист Николай Вахтин дал большое интервью о русских диалектах 


Что вы думаете о речи молодежи?

Старшее поколение недовольно, а специалисты видят основания для оптимизма



Безударные гласные в некоторых словах могут редуцироваться до нуля

Вышел четвертый выпуск журнала «Русская речь» за 2024 год


Как в русском языке возникали названия для новых профессий

Ирина Фуфаева — о трех случаях, когда родное слово оттеснило иностранного конкурента


Для чего нужен язык в первую очередь

Нейробиологи пришли к выводу, что мышление может существовать и без языка


1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!