Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...До нас дошел очень большой массив рукописей на церковнославянском...
Международная группа математиков и историков из Великобритании и США представила систему искусственного интеллекта, способную восстанавливать частично утраченные надписи на латинском языке. Разработка, получившая название «Эней» (в честь легендарного героя Троянской войны), уже продемонстрировала высокую точность реконструкции — 90% успешных случаев. Об этом сообщает публикация в авторитетном научном журнале Nature. Для обучения ...
...Международная группа математиков и историков из...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
В Турции запустили сервис на базе искусственного интеллекта, способный трансформировать практику изучения документов на османском турецком языке, который был государственным языком Османской империи вплоть до XX века. С его помощью исследователи могут читать документы, хранящиеся в библиотеках, в цифровом виде, а также осуществлять поиск по их содержанию. Письменный язык на основе арабского алфавита, бытовавший в Османской империи, сегодня изучается в
...В Турции запустили сервис на базе искусственного...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.
...Уже сейчас писатели издают книги, которые написаны...
...Кто лучше напишет рассказ? В ходе эксперимента писателю...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
«Зубодробительный», «заумный», «трескучий» — так говорят про язык законов, инструкций, договоров и соглашений. Мы привыкли мириться с ним, раз «так нужно». Но государство и бизнес наконец сами задумались о том, чтобы говорить проще. Какие есть инструменты, которые им в этом помогут?
...«Зубодробительный», «заумный»...
...Какой язык называют простым Простой язык (plain language...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...
Принципы коммуникативной эффективности и основы права требуют, чтобы законы были понятны обывателям, однако эмпирические данные свидетельствуют о том, что юридические документы в основном непонятны как юристам, так и неспециалистам. Как известно, законы содержат поразительно высокий уровень сложных синтаксических структур по сравнению с другими жанрами текстов. В исследовании, опубликованном в PNAS, ученые из США, Великобритании и Австралии ...
...Принципы коммуникативной эффективности и основы...