К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Нейросети произвели настоящую революцию, показав, что искусственный интеллект способен создавать тексты не хуже людей (некоторые писатели даже выпустили книги в соавторстве с ИИ). Одна из самых популярных нейросетей — ChatGPT от компании Open AI. Что происходит у нее «под капотом»?
...Нейросети произвели настоящую революцию, показав, что...
...Стивен Вольфрам — британский физик, математик...
Лингвист Максим Кронгауз дал два интервью: каналу «Основа» и каналу «Поговорим про РКИ (русский язык как иностранный)». Речь шла о том, почему приставки в русском языке более «живые», чем в романских, чем обращения в русском отличаются от других языков, как на естественный язык повлияет искусственный интеллект и чем интересен новояз из романа Джорджа Оруэлла «1984».
...Лингвист Максим Кронгауз дал два интервью: каналу &...
...1. Приставка в русском языке способна быть центром...
Цифровые образовательные материалы получат народы, не имеющие достаточного количества учебников родного языка и литературного чтения. Об этом сообщает ТАСС со ссылкой на пресс-службу издательства «Наука». Суть проекта в том, что активисты-киберволонтеры собирают данные о существующих учебных пособиях, созданных носителями языков и учеными. Эти пособия и другая литература, помогающая сохранять и преподавать языки коренных народов, сначала выпускается ...
...Цифровые образовательные материалы получат народы,...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя. Это справочно-информационная платформа, созданная на основе девяностотомного собрания сочинений Льва Толстого, которая дает пользователю возможность проводить поиск по огромному корпусу текстов писателя, предоставляет справочные материалы как для специалистов, так и для широкого круга читателей. 19 ноября 2024 года проект презентовал цифровую хронику жизни Льва Толстого, основанную на ...
...Проект «Слово Толстого» — цифровой...
Представьте: вы договорились встретиться с другом на площади, но когда пришли — она оказалась переполненной. Все говорят, смеются, к тому же из динамиков гремит музыка. Вдруг вы замечаете в толпе друга. Как позвать его? Голос утонет в шуме. А теперь представьте, что вы заранее договорились хлопать в ладоши (или свистеть) в определенном ритме, чтобы сообщить о себе. Громкие ритмичные звуки будут выделяться на
...Представьте: вы договорились встретиться с ...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Мы оцениваем «оканье» как явление диалектное. Но это не что иное, как наше языковое убеждение, связанное с нашим языковым шовинизмом: то, как у нас, — правильно, то, как у других, — неправильно. Если бы наши предки оставили столицу на территории Владимиро-Суздальского княжества, те, кто говорит на а, казались бы нам очень смешными, а «оканье» было бы литературной нормой. Об этом и о многом другом рассказывает диалектолог, кандидат филологических ...
...Мы оцениваем «оканье» как явление диалектное...
В блоке команды чат-бота BotHub на портале «Хабр» вышла статья о том, может ли машинный интеллект находить и исправлять ошибки в русскоязычном тексте, как настоящий корректор. Для испытания автор отобрал 13 популярных инструментов — от передовых языковых моделей до специализированных корректорских сервисов.
...В блоке команды чат-бота BotHub на портале...
...Методология Автор стремился выжать из ИИ-корректоров...
Команда Грамоты за прошедшую неделю внесла несколько обещанных изменений в работу обновленного портала: размер поля для вопроса справочной службе увеличился до 1000 символов; добавлена возможность использовать в поисковой строке символы (* и ?), что позволяет искать в текстовых материалах сразу группу похожих слов; для большинства словарей в словарных статьях, которые появляются в результатах поиска, воспроизводится их исходная разметка. Кроме того, мы теперь с ...
...Команда Грамоты за прошедшую неделю внесла несколько...