Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
На примере проекта Chekhov Digital онлайн-журнал «Системный Блокъ» рассказывает о семантическом издании и о том, чем оно полезно.
...На примере проекта Chekhov Digital онлайн-журнал...
...Проект Chekhov Digital посвящен изучению литературного...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Доля доходов от продажи аудиоверсий в категории «русская классика» у сервиса электронных и аудиокниг «Литрес» достигла 70% от общего объема продаж. Сегодня пользователи явно предпочитают слушать русскую классику, а не читать ее. Для сравнения, зарубежную классику примерно одинаково любят и читать, и слушать. В топ-5 русской классики за первые пять месяцев 2025 года вошли исключительно аудиокниги: «Война ...
...Доля доходов от продажи аудиоверсий в категории...
Технологии стремительно развиваются и всё больше влияют на нашу жизнь. Сегодня важная часть досуга огромного количества людей — компьютерные игры. Внутри сообщества геймеров давно сложился свой жаргон, который может быть непонятен тем, кто далек от игровых сообществ. При этом некоторые слова из этой сферы стали употребляться гораздо шире и вошли в молодежный сленг и разговорную речь.
...Технологии стремительно развиваются и всё больше...
...Что мы называем жаргоном В лингвистике под...
Анна Константиновна Поливанова рассказала проекту Arzamas о своем детстве, об отношениях с учителями, взглядах на язык и принципах рациональной науки. Этот большой разговор будет интересен не только лингвистам.
...Анна Константиновна Поливанова рассказала проекту...
...Учителями Анны Поливановой были Андрей Зализняк, Юрий...
Команда Грамоты за прошедшую неделю внесла несколько обещанных изменений в работу обновленного портала: размер поля для вопроса справочной службе увеличился до 1000 символов; добавлена возможность использовать в поисковой строке символы (* и ?), что позволяет искать в текстовых материалах сразу группу похожих слов; для большинства словарей в словарных статьях, которые появляются в результатах поиска, воспроизводится их исходная разметка. Кроме того, мы теперь с ...
...Команда Грамоты за прошедшую неделю внесла несколько...
В Турции запустили сервис на базе искусственного интеллекта, способный трансформировать практику изучения документов на османском турецком языке, который был государственным языком Османской империи вплоть до XX века. С его помощью исследователи могут читать документы, хранящиеся в библиотеках, в цифровом виде, а также осуществлять поиск по их содержанию. Письменный язык на основе арабского алфавита, бытовавший в Османской империи, сегодня изучается в
...В Турции запустили сервис на базе искусственного...
С 2022 года в Марий Эл специалисты разрабатывают учебно-методический комплект «Марийский (родной) язык». На прошлой неделе электронный учебник презентовали на собрании ассоциации учителей родных языков республики в Йошкар-Оле. Изучать марийский язык в электронной форме смогут школьники 5–9-х классов, сообщает минобрнауки Марий Эл. Учебники и пособия по марийскому языку планируется включить в федеральный перечень учебников. По данным этнолингвистических ...
...С 2022 года в Марий Эл специалисты разрабатывают учебно-методический...
Проект запустился около года назад, когда научно-образовательный союз «Родное слово» вместе с командой Tolstoy Digital выиграл грант Президентского фонда культурных инициатив. С тех пор в интернете создается новое пространство — цифровой путеводитель по наследию Льва Толстого. Он заинтересует людей гуманитарных профессий и всех, кто любит русскую литературу и ищет новые способы узнавать ее глубже. Благодаря современным технологиям путеводитель будет включать систему навигации и ...
...Проект запустился около года назад, когда научно-образовательный...