Подсказки для поиска

В Турции создали цифровой сервис для работы с текстами на османском языке

В Турции запустили сервис на базе искусственного интеллекта, способный трансформировать практику изучения документов на османском турецком языке, который был государственным языком Османской империи вплоть до XX века. С его помощью исследователи могут читать документы, хранящиеся в библиотеках, в цифровом виде, а также осуществлять поиск по их содержанию.

Письменный язык на основе арабского алфавита, бытовавший в Османской империи, сегодня изучается в рамках истории, литературы и тюркологии. В 1928 году в рамках обширной языковой реформы Мустафы Кемаля Ататюрка была введена латиница. Новый инструмент позволяет транслитерировать на латиницу миллионы страниц текста с высокой точностью.

За разработкой программы стоит команда предпринимателей во главе с Абдуллой Тарыком Омероглу. Проект зародился в 2020 году, когда Омероглу, будучи студентом Босфорского университета, готовил книги для издательства. Вместе с другом-программистом он задумал создать инструмент, который облегчит доступ к этим текстам. Получив поддержку TÜBİTAK BİGG (программа индивидуальной поддержки молодых предпринимателей), они основали свою компанию в технопарке ITU.

После трех с половиной лет разработки команда успешно внеднила систему объединения документов из разных библиотек (в том числе тех, которые не дают прямой удаленный доступ к своим фондам). Она позволяет пользователям осуществлять поиск по семи миллионам страниц документов и получать транслитерированные версии необходимых текстов.

Омероглу и его команда планируют внедрить упрощенные турецкие версии текстов, добавить чат-боты и системы автоматического реферирования, чтобы сделать взаимодействие с архивами еще удобнее. Будущие обновления также помогут пользователям быстро получать ответы на вопросы о времени, авторе и ключевых идеях документов.

Основатели проекта отмечают, что исследователи могут получить доступ к программе за минимальную плату, что способствует доступности и широкому охвату новой системы.

Портал «Грамота.ру»

Еще на эту тему

Лингвистический пуризм: как в разных странах защищают государственный язык от внешнего влияния

Проблема заимствований обычно возникает по политическим причинам

Нейросеть помогает работать с церковнославянскими рукописями

Электронные издания старых книг могут заменить архивы

Исследователи расшифровали древнюю надпись с помощью искусственного интеллекта

Свиток с ней сильно обгорел в результате извержения Везувия почти 2000 лет назад

все публикации

В издательстве «МИФ» вышла книга о книгах

Как создавали, распространяли и запрещали книги

Андрей Кибрик о русскоязычных жителях Аляски и особенностях их диалекта

Сохранить аляскинский русский невозможно, но необходимо его документировать

Чем нас привлекает общение с языковыми моделями

Чат-бот может быть удобным собеседником, но для некоторых людей это удобство чревато проблемами

В научном сообществе исследование обсценных слов находится под запретом

Так считают авторы заметок о русском мате Анатолий Баранов и Дмитрий Добровольский

Лучшие программы-корректоры на основе ИИ

Роботы уже могут исправить большинство ошибок, но сами добавляют новые

Горячая десятка заимствований: что тут сложного?

Пользователи Грамоты часто ищут информацию об этих заимствованиях, которые еще не освоились в русском языке

Язык тела: как жесты помогают нам общаться

Они дополняют, уточняют и даже заменяют слова

Елочки или лапки? Как правильно использовать кавычки

Они нужны для оформления прямой речи, цитат, названий, а также слов, использованных иронически

Мария Каленчук: «Да, мы ориентируемся на живую речь!»

В издательстве «Грамота» вышел Большой словарь ударений

Кто эффективнее в изучении языка — человек или нейросеть?

«Язык опирается на врожденную систему знаний», — объясняет лингвист Наталия Слюсарь

Не только люди: с кем еще мы разговариваем по душам?

Лингвист Валерий Шульгинов напоминает, что до появления чат-ботов люди охотно общались со стихиями, куклами и техникой

Нейтральный язык эсперанто: благородная попытка объединить человечество

Был ли шанс у этого проекта, на который доктор Заменгоф потратил многие годы?

Что было написано на яблоке раздора? Тест на знание истории крылатых слов

Часто мы используем устойчивые выражения, точный смысл которых от нас ускользает

Как пишутся сложные топонимы: правила и исключения

Ново-Огарево отличается от Новосибирска, как Соль-Илецк от Сольвычегодска

Попадает в самое сердечко... Почему теперь так говорят?

Лингвист Ирина Фуфаева ищет причины экспансии этого диминутива в современной речи

Лингвист Борис Орехов: «Корпус русской классики дает доступ в языковую лабораторию авторов»

В Национальном корпусе русского языка теперь можно изучать и сравнивать языки писателей XIX века

Всё о чувствах и отношениях: почему язык психологии стал так популярен

Лингвисты, социологи и психологи обсуждают вред и пользу психотерапевтической волны в русском языке

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!