Подсказки для поиска

В Турции создали цифровой сервис для работы с текстами на османском языке

В Турции запустили сервис на базе искусственного интеллекта, способный трансформировать практику изучения документов на османском турецком языке, который был государственным языком Османской империи вплоть до XX века. С его помощью исследователи могут читать документы, хранящиеся в библиотеках, в цифровом виде, а также осуществлять поиск по их содержанию.

Письменный язык на основе арабского алфавита, бытовавший в Османской империи, сегодня изучается в рамках истории, литературы и тюркологии. В 1928 году в рамках обширной языковой реформы Мустафы Кемаля Ататюрка была введена латиница. Новый инструмент позволяет транслитерировать на латиницу миллионы страниц текста с высокой точностью.

За разработкой программы стоит команда предпринимателей во главе с Абдуллой Тарыком Омероглу. Проект зародился в 2020 году, когда Омероглу, будучи студентом Босфорского университета, готовил книги для издательства. Вместе с другом-программистом он задумал создать инструмент, который облегчит доступ к этим текстам. Получив поддержку TÜBİTAK BİGG (программа индивидуальной поддержки молодых предпринимателей), они основали свою компанию в технопарке ITU.

После трех с половиной лет разработки команда успешно внеднила систему объединения документов из разных библиотек (в том числе тех, которые не дают прямой удаленный доступ к своим фондам). Она позволяет пользователям осуществлять поиск по семи миллионам страниц документов и получать транслитерированные версии необходимых текстов.

Омероглу и его команда планируют внедрить упрощенные турецкие версии текстов, добавить чат-боты и системы автоматического реферирования, чтобы сделать взаимодействие с архивами еще удобнее. Будущие обновления также помогут пользователям быстро получать ответы на вопросы о времени, авторе и ключевых идеях документов.

Основатели проекта отмечают, что исследователи могут получить доступ к программе за минимальную плату, что способствует доступности и широкому охвату новой системы.

Еще на эту тему

Лингвистический пуризм: как в разных странах защищают государственный язык от внешнего влияния

Проблема заимствований обычно возникает по политическим причинам

Нейросеть помогает работать с церковнославянскими рукописями

Электронные издания старых книг могут заменить архивы

Исследователи расшифровали древнюю надпись с помощью искусственного интеллекта

Свиток с ней сильно обгорел в результате извержения Везувия почти 2000 лет назад

все публикации

Главред Грамоты Ксения Киселева: «Мы играем в новые слова!» 

Диалог с Игорем Исаевым о Грамоте и грамотности на канале «Сложное предложение»

Опять об Пушкина! Тест ко дню рождения поэта

Десять вопросов для тех, кто любит «наше всё»

Как генеративный ИИ меняет понятие авторского права

Шутка «тятя, тятя, нейросети пишут лучше Гришковца!» может стать реальностью

Гугол, Пеппи и левидром: детские слова, изменившие мир

Пять историй о том, как полезно бывает прислушаться к ребенку

«Работает она!» Воображаемая аудитория и реплики-перевертыши в диалогах

Лингвист Ирина Левонтина описывает легкий способ обесценить слова собеседника

Сразу после букваря: как Букли помогают ребенку стать читателем

В основе нового проекта издательства «Грамота» лежит принцип ненасильственного чтения

Лингвист Игорь Мельчук о машинном переводе, модели «Смысл — Текст» и науке в СССР

Все пять частей разговора доступны на канале «Глагольная группа»

История с каллиграфией: чем интересна славянская письменность

В XVII веке у каждой буквы было несколько альтернативных форм написания

Из чего приготовлен салат? Тест для тренировки перед ЕГЭ

Чтобы успешно сдать экзамен по русскому языку, важно уметь переключаться между разными темами

Бабай, Лукоморье, свистопляска и другие «нечистые» слова

Сергей Антонов находит следы славянского язычества в современной русской речи

Что можно узнать о грамматике мундари и иврита, решая лингвистические задачи?

При переводе на иврит русское выражение может превратиться в одно слово

Лингвистические лакуны: слова, которых нам очень не хватает

Почему мы не можем сказать «я ихнего борца победю»?

Нишевые нетакуси: а что если все — не такие, как все?

Лингвист Ирина Левонтина рассуждает о выгодных и неприятных сторонах пребывания в нише

«Говорим по-русски!»: три рассказа о церковнославянском языке

Постную Триодь исправили тайно, чтобы избежать нового церковного раскола

«Можно, пожалуйста, присесть?»

Новый речевой этикет против языковых традиций

От копирайта до копилефта: как менялось авторское право на тексты

Почему «Гамлет» при жизни Шекспира принадлежал театральной труппе и чем важен спор вокруг Микки Мауса

Модные слова добавляют ярких красок в палитру общения

Ими хочется щеголять, но лучше делать это аккуратно, считают гости программы «Наблюдатель»

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!