Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Новогодняя игра: Грамота предсказывает будущее. Хочу погадать!
Хочу погадать!

Нейросеть помогает работать с церковнославянскими рукописями

Нейросеть помогает работать с церковнославянскими рукописями
В коллаже использованы материалы фотобанка Unsplash

Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке. 

До нас дошел очень большой массив рукописей на церковнославянском языке, но у сотрудников библиотек не хватает времени, чтобы оцифровать весь этот огромный материал, что делает его недоступным для исследователей. Новые технологии, прежде всего нейросети, позволяют получить картину бытования и изменения этих текстов, показать, какой вариант текста первичен, в какое время он изменялся в результате редактирования и т. д. 

Распознанные церковнославянские тексты представляют большую ценность для обучения нейросетей, тестирования новых программных средств и методик. Однако пока отсутствует база данных с таким объемом текстов, чтобы к ним можно было применять корпусные методы. Лаборатория цифровой лингвистики МИФИ работает над созданием такой базы совместно с Институтом русского языка им. В. В. Виноградова РАН (Дмитрий Демидов — кандидат технических наук, доцент МИФИ, Александра Плетнева — кандидат филологических наук, ведущий научный сотрудник Научного центра по изучению церковнославянского языка ИРЯ РАН). 

В будущем, вероятно, лингвисты совместно с программистами научат нейросеть различать манеры разных писцов, чтобы решать вопросы палеографии (например, датировку) и определять начертания, которые характерны для конкретных эпох и авторов. Большая сложность заключается в том, что в церковнославянском много надстрочных символов, диакритических знаков. А еще внутри текста бывают особые значки — указания для церковного пения, своего рода язык в языке. Эти символы необходимо сохранить, а чтобы прочесть их, нужны особые методы сегментации. 

Распознанные тексты можно будет превратить в будущем в электронные издания, которые будут интересны не только узким специалистам, но и всем, кто интересуется старыми текстами и хочет посмотреть, как выглядели книги в XII, XVII или XVIII веке. 

Портал «Грамота.ру»

Еще на эту тему

Как читать «Сказание о Борисе и Глебе»

Андрей Ранчин — об одном из основополагающих текстов русской духовной культуры

все публикации


Как измерить сложность и сбалансированность языка в учебниках?

Об этом — статья Антонины Лапошиной и Марии Лебедевой в журнале «Русский язык в школе»



Тест: в каком предложении правильно расставлены запятые?

Вспоминаем, как оформляются причастные обороты, однородные члены предложения и вводные слова


Шиликун в озере и постен на стене: как в разных регионах зовется хтонь 

Лингвист Ирина Фуфаева о происхождении названия одного псковского домового


Ненецкий счет, русское яканье и экзотический язык Новой Гвинеи на портале «Элементы»

Решение лингвистических задач позволяет нелингвистам больше узнать об устройстве языка


Необычные игры в слова: пять вариантов для интеллектуальной вечеринки

Одна из них родилась после визита Индиры Ганди, а другая вдохновлена корпусной лингвистикой



Что такое достаточно хорошая речь сегодня: главные критерии

Хорошая речь по-прежнему должна быть чистой, точной, ясной, но в первую очередь — уместной


Как чаще всего возникали неологизмы в коронавирусную эпоху

Словообразование и фразеология в шестом номере журнала «Русская речь» за 2024 год


Новогодний тест: где нужны прописные буквы?

Проверьте, хорошо ли вы помните правила правописания слов и выражений, которые нужны раз в году



Фантастические слова в поисковых запросах Грамоты: окказионализмы 2024 года

Омбомодор, пледовитая и мангобездарь ковшкручинятся из-за вырожжерика


Смех не без причины: лингвисты изучили языковые особенности «пирожков» и «порошков»

Новая книга Максима Кронгауза и Марии Ковшовой рассказывает об интернет-поэзии



Математик Константин Воронцов: «Текст становится тормозом развития цивилизации»

Специалист по цифровой гуманитаристике — о том, как нейросети меняют работу с языком и к чему стоит готовиться педагогам


Язык поколений: в чем разница между лексиконами зумеров, миллениалов, бумеров и иксеров

Поколенческие черты не ограничиваются лексиконом, но лингвисты не видят языковых препятствий для взаимопонимания



Тест: как правильно расставить ударения?

Двадцать не самых сложных и очень нужных слов, в которых лучше не ошибаться


«Почему он не читает?» Книга советов Алихана Динаева для родителей, учителей и других взрослых

Какова бы ни была причина, автор предлагает не опускать руки и искать свой способ приобщить ребенка к радостям чтения


1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!