Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

В Турции создали цифровой сервис для работы с текстами на османском языке

В Турции запустили сервис на базе искусственного интеллекта, способный трансформировать практику изучения документов на османском турецком языке, который был государственным языком Османской империи вплоть до XX века. С его помощью исследователи могут читать документы, хранящиеся в библиотеках, в цифровом виде, а также осуществлять поиск по их содержанию.

Письменный язык на основе арабского алфавита, бытовавший в Османской империи, сегодня изучается в рамках истории, литературы и тюркологии. В 1928 году в рамках обширной языковой реформы Мустафы Кемаля Ататюрка была введена латиница. Новый инструмент позволяет транслитерировать на латиницу миллионы страниц текста с высокой точностью.

За разработкой программы стоит команда предпринимателей во главе с Абдуллой Тарыком Омероглу. Проект зародился в 2020 году, когда Омероглу, будучи студентом Босфорского университета, готовил книги для издательства. Вместе с другом-программистом он задумал создать инструмент, который облегчит доступ к этим текстам. Получив поддержку TÜBİTAK BİGG (программа индивидуальной поддержки молодых предпринимателей), они основали свою компанию в технопарке ITU.

После трех с половиной лет разработки команда успешно внеднила систему объединения документов из разных библиотек (в том числе тех, которые не дают прямой удаленный доступ к своим фондам). Она позволяет пользователям осуществлять поиск по семи миллионам страниц документов и получать транслитерированные версии необходимых текстов.

Омероглу и его команда планируют внедрить упрощенные турецкие версии текстов, добавить чат-боты и системы автоматического реферирования, чтобы сделать взаимодействие с архивами еще удобнее. Будущие обновления также помогут пользователям быстро получать ответы на вопросы о времени, авторе и ключевых идеях документов.

Основатели проекта отмечают, что исследователи могут получить доступ к программе за минимальную плату, что способствует доступности и широкому охвату новой системы.

Портал «Грамота.ру»

Еще на эту тему

Лингвистический пуризм: как в разных странах защищают государственный язык от внешнего влияния

Проблема заимствований обычно возникает по политическим причинам

Нейросеть помогает работать с церковнославянскими рукописями

Электронные издания старых книг могут заменить архивы

Исследователи расшифровали древнюю надпись с помощью искусственного интеллекта

Свиток с ней сильно обгорел в результате извержения Везувия почти 2000 лет назад

все публикации

«Нелицеприятная оценка»: странные формы и употребления на пути из ошибок в норму

Лингвист Ирина Фуфаева с интересом наблюдает за говорящими, уверенными в своей непогрешимости

Заец, Журавель и Казаченок: как склонять такие фамилии

Можно обратиться к словарю фамилий или прислушаться к мнению носителя

Светлана Гурьянова: «Главное — не запутаться в том, какое правило нужно применить!»

Подробный разговор о сложных заданиях на ЕГЭ, материалах для подготовки и настрое перед экзаменом

Денис Фонвизин: живая речь в комедиях и системность в словаре

Рассказываем о ключевых исторических фигурах, повлиявших на развитие русского языка

Что такое темематический язык и почему он так называется

На портале «Элементы» появились три новые лингвистические задачи

Склонение грузинских фамилий в русском языке

От Берии до Данелии и от Коставы до Окуджавы

Неологизмы бросают вызов лексикографам. Как на него ответит Лексикон Грамоты?

Чтобы ответить на запрос пользователей, выбираем слова-кандидаты, анализируем употребления, описываем значения

Мелетий Смотрицкий: архитектор славянской грамматики

Рассказываем о ключевых исторических фигурах, повлиявших на развитие русского языка

Мелет или мелит? Не трожь или не трогай? Изучаем глаголы со сложным характером

Ошибки нередко проливают свет на глубинные свойства языковой системы

Язык в большом городе: три способа адаптации к обстоятельствам

Лингвист Валерий Шульгинов — о родственных связях, чечиках и политкорректности

Как подготовиться к Тотальному диктанту за 10 дней

Вспомнить всё и получить хорошую оценку (хотя это не главное)

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!