Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Нейросеть помогает работать с церковнославянскими рукописями

Нейросеть помогает работать с церковнославянскими рукописями
В коллаже использованы материалы фотобанка Unsplash

Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке. 

До нас дошел очень большой массив рукописей на церковнославянском языке, но у сотрудников библиотек не хватает времени, чтобы оцифровать весь этот огромный материал, что делает его недоступным для исследователей. Новые технологии, прежде всего нейросети, позволяют получить картину бытования и изменения этих текстов, показать, какой вариант текста первичен, в какое время он изменялся в результате редактирования и т. д. 

Распознанные церковнославянские тексты представляют большую ценность для обучения нейросетей, тестирования новых программных средств и методик. Однако пока отсутствует база данных с таким объемом текстов, чтобы к ним можно было применять корпусные методы. Лаборатория цифровой лингвистики МИФИ работает над созданием такой базы совместно с Институтом русского языка им. В. В. Виноградова РАН (Дмитрий Демидов — кандидат технических наук, доцент МИФИ, Александра Плетнева — кандидат филологических наук, ведущий научный сотрудник Научного центра по изучению церковнославянского языка ИРЯ РАН). 

В будущем, вероятно, лингвисты совместно с программистами научат нейросеть различать манеры разных писцов, чтобы решать вопросы палеографии (например, датировку) и определять начертания, которые характерны для конкретных эпох и авторов. Большая сложность заключается в том, что в церковнославянском много надстрочных символов, диакритических знаков. А еще внутри текста бывают особые значки — указания для церковного пения, своего рода язык в языке. Эти символы необходимо сохранить, а чтобы прочесть их, нужны особые методы сегментации. 

Распознанные тексты можно будет превратить в будущем в электронные издания, которые будут интересны не только узким специалистам, но и всем, кто интересуется старыми текстами и хочет посмотреть, как выглядели книги в XII, XVII или XVIII веке. 

Портал «Грамота.ру»

Еще на эту тему

Как читать «Сказание о Борисе и Глебе»

Андрей Ранчин — об одном из основополагающих текстов русской духовной культуры

все публикации

Луи Брайль, человек-шрифт

Самый удобный тактильный алфавит изобрел двести лет назад незрячий подросток


Как искусственный интеллект изменит возможности Грамоты

Умный поиск, обновленная Справка и текстовый робот-ассистент


Как цифровизация помогает сохранить языки коренных народов России

Голосовые помощники, цифровые учебники и онлайн-переводчики вносят вклад в создание языковой среды


Лошадь, колесо и язык. Как наездники бронзового века сформировали современный мир

Распространению праиндоевропейского языка помогли верховая езда и боевые колесницы


Как к вам лучше обращаться?

Приключения дамы и господина в России


Темная тайна «дня»: куда убежали беглые гласные

Почему слова «сон» и «слон» склоняются по-разному



Поэтический перевод как прыжок в невозможное

Переводчик современной китайской поэзии Юлия Дрейзис хочет заставить русский язык передать не только смысл, но и форму оригинала


Что мешает специалистам писать понятные тексты

В книге «Чувство стиля» психолингвист Стивен Пинкер предлагает решения, основанные на данных когнитивной психологии


Миф о врожденной грамотности и правда о тех, кто пишет без ошибок

Как развить в себе орфографические суперспособности


На канале «Глагольная группа» вышел стрим о феминитивах

Что лингвисты думают об «авторках» и о влиянии волевых решений на развитие языка


Что такое академическая наука

Члены РАН ответили на наши вопросы перед юбилеем Академии


Юрист оценила последствия борьбы с иностранными заимствованиями

В результате запретов может пострадать бизнес, особенно торговля и реклама


В издательстве «Иллюминатор» вышла книга воспоминаний переводчика Григория Кружкова 

Как киплинговский паттеран превратился в кочевую звезду из «Жестокого романса»



На канале «Основа» вышел разговор с Александром Пиперски

Как устроены ударения в русском и на каком языке говорит ИИ


Сохранение авторского стиля при переводе: искусство грамотно спотыкаться

Как передать чужой синтаксис своими средствами, рассказывает переводчик Наталья Мавлевич


Россия и Русь, россияне и русские: откуда пошли эти самоназвания

Как они возникли, почему раздвоились и при чем тут греки с римлянами


Вышел в свет шестой выпуск журнала «Русская речь» за 2023 год

Лингвистический ландшафт российских городов и глокая куздра, которая изначально была кудматой бокрой


Цифровые инструменты в помощь редактору

Можно автоматизировать часть процессов, чтобы осталось время на ручную работу