Подсказки для поиска

В Турции создали цифровой сервис для работы с текстами на османском языке

В Турции запустили сервис на базе искусственного интеллекта, способный трансформировать практику изучения документов на османском турецком языке, который был государственным языком Османской империи вплоть до XX века. С его помощью исследователи могут читать документы, хранящиеся в библиотеках, в цифровом виде, а также осуществлять поиск по их содержанию.

Письменный язык на основе арабского алфавита, бытовавший в Османской империи, сегодня изучается в рамках истории, литературы и тюркологии. В 1928 году в рамках обширной языковой реформы Мустафы Кемаля Ататюрка была введена латиница. Новый инструмент позволяет транслитерировать на латиницу миллионы страниц текста с высокой точностью.

За разработкой программы стоит команда предпринимателей во главе с Абдуллой Тарыком Омероглу. Проект зародился в 2020 году, когда Омероглу, будучи студентом Босфорского университета, готовил книги для издательства. Вместе с другом-программистом он задумал создать инструмент, который облегчит доступ к этим текстам. Получив поддержку TÜBİTAK BİGG (программа индивидуальной поддержки молодых предпринимателей), они основали свою компанию в технопарке ITU.

После трех с половиной лет разработки команда успешно внеднила систему объединения документов из разных библиотек (в том числе тех, которые не дают прямой удаленный доступ к своим фондам). Она позволяет пользователям осуществлять поиск по семи миллионам страниц документов и получать транслитерированные версии необходимых текстов.

Омероглу и его команда планируют внедрить упрощенные турецкие версии текстов, добавить чат-боты и системы автоматического реферирования, чтобы сделать взаимодействие с архивами еще удобнее. Будущие обновления также помогут пользователям быстро получать ответы на вопросы о времени, авторе и ключевых идеях документов.

Основатели проекта отмечают, что исследователи могут получить доступ к программе за минимальную плату, что способствует доступности и широкому охвату новой системы.

Портал «Грамота.ру»

Еще на эту тему

Лингвистический пуризм: как в разных странах защищают государственный язык от внешнего влияния

Проблема заимствований обычно возникает по политическим причинам

Нейросеть помогает работать с церковнославянскими рукописями

Электронные издания старых книг могут заменить архивы

Исследователи расшифровали древнюю надпись с помощью искусственного интеллекта

Свиток с ней сильно обгорел в результате извержения Везувия почти 2000 лет назад

все публикации

Как используется слово «фидбэк» в современном русском языке

Вышел второй номер журнала «Русская речь» за 2026 год

Школьный жаргон XIX века: бонсюжешки ушли, а ерунда осталась

Про гимназическое прошлое многих слов мы даже не догадываемся

Как редполитика помогает Госуслугам оставаться понятными для всех

Интервью с Анастасией Баевой — ответственным редактором портала и ведущей канала «Редполитика Госуслуг»

10 слов, в которых нам наконец разрешили привычные варианты ударений

«Большой словарь ударений» признает влияние узуса на норму

Курс Владимира Плунгяна поможет разобраться в основах лингвистики

Уникальное свойство языка — делать мысль материальной

«Обязательная программа»: что общего есть у разных языков

Олег Беляев объясняет, как сравнение непохожих языков помогает понять логику их развития

Смешенье языков: можно ли скрестить русский с китайским?

Лингвист Валерий Шульгинов описывает свойства этого гибрида, опираясь на данные реальных пиджинов

Как русский язык помогает осваивать другие школьные предметы

Рассказывают учителя — финалисты четвертого сезона проекта «Классная тема!»

Что значит «залететь в реки»?

Лингвист Ирина Левонтина изучила новые употребления русского приставочного глагола

Зачем нужно сохранять исчезающие языки

Лингвист Ольга Казакевич — о ценности языкового разнообразия для человека и общества

Псевдо, квази, эрзац и другие: пять способов указать на неполное сходство

Чем отличаются разные виды «фейков» с лингвистической точки зрения

Русский язык не сводится к его литературной форме. Лекция Максима Кронгауза

Субстандарт: питательная среда или испытательный полигон?

Откуда берутся разные варианты произношения?

Вышла книга Марии Каленчук об орфоэпических словарях

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!