Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...До нас дошел очень большой массив рукописей на церковнославянском...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
К числу включенных в декабре 2023 года слов, называющих актуальные явления и предметы, относятся, например, датасет, ИИ, ИТ-профессия, ИТ-специалист, косплей, косплейный, косплеер, майнинг, маркетплейс, медиакарта, мурал, инвестиционно привлекательный. Словарь также пополнили термины разных специальностей и областей знания, например: благополучатель, инофон (человек, не владеющий русским языком, для которого русский язык неродной, дети-инофоны), каподастр (ограничитель на грифе ...
...К числу включенных в декабре 2023 года слов, называющих...
На примере проекта Chekhov Digital онлайн-журнал «Системный Блокъ» рассказывает о семантическом издании и о том, чем оно полезно.
...На примере проекта Chekhov Digital онлайн-журнал...
...Проект Chekhov Digital посвящен изучению литературного...
Новый сервис создала компания SberDevices — партнер Сбера. По данным разработчиков, модель на основе искусственного интеллекта обучена на примерах, покрывающих большинство часто встречающихся источников текста и их особенностей: новости, социальные сети, отзывы, субтитры, интернет-страницы, блоги и статьи. Сервис поддерживает только русский язык и не исправляет пунктуацию — она остается на усмотрение автора. Объем текста, который можно загружать для ...
...Новый сервис создала компания SberDevices &mdash...
9 ноября Министерство просвещения опубликовало проект «новых», как писали о них СМИ, «Правил русской орфографии». Туда действительно вошли относительно новые слова вроде «риелтор», «каршеринг», «дилер», «пленэр» и многие другие. Но новые ли это правила и ждет ли нас языковая реформа? «Мел» разбирается вместе с лингвистами.
...9 ноября Министерство просвещения опубликовало проект...
...В частности, в статье приводится комментарий Владимира...
Чтобы правильно диагностировать у ребенка затруднения при чтении, необходима консультация специалиста. Но тревога родителей по этому поводу тоже может быть довольно точным индикатором наличия проблем, выяснили исследователи Университета Западного Онтарио (Канада). В исследовании принимали участие 34 школы Онтарио. Авторы работы обратились к родителям учащихся и попросили заполнить анкету об академическом развитии их детей. Параллельно дети проходили стандартизированные тесты на чтение и ...
...Чтобы правильно диагностировать у ребенка затруднения...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Перед вами третье задание конкурса, в котором есть задачки попроще и посложнее.
...Перед вами третье задание конкурса, в котором есть...
...Задания попроще 1. Буквомешалки Смешав и переставив...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...