В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
25 сентября в Рязанской библиотеке имени А. М. Горького состоялась презентация книги «„Дорогой для меня цвет семейности“. Фотоальбом династии Срезневских». На XI Межрегиональном фестивале национальной книги «Читающий мир» это издание стало победителем в номинации «Издание, вносящее вклад в диалог культур».
...25 сентября в Рязанской библиотеке имени А. М. Горького...
...Имя слависта Измаила Срезневского (1812–1880)...
Когда говорят о заимствованиях, чаще всего представляют себе иностранные слова, проникающие в русский язык. А как насчет обратного пути — из русского языка в другие? Таких случаев тоже немало, и это отнюдь не только банальные vodka и sputnik. О некоторых интересных перемещениях слов рассказывает лингвист Мария Елифёрова.
...Когда говорят о заимствованиях, чаще всего представляют...
...Самое древнее заимствование из русского, восходящее...
Завершился очередной этап совершенствования инструментов, которыми можно пользоваться на Грамоте. Сегодня расскажем о самых заметных изменениях в том, что касается поиска. 1. Теперь на странице поиска есть тумблер, который позволяет переключаться между точным и умным поиском. По умолчанию ищется точное совпадение с тем запросом, который ввел пользователь в строке поиска: ровно те же знаки в том же порядке, без учета словоформ и похожих вариантов (тумблер ...
...Завершился очередной этап совершенствования инструментов...
В блоке команды чат-бота BotHub на портале «Хабр» вышла статья о том, может ли машинный интеллект находить и исправлять ошибки в русскоязычном тексте, как настоящий корректор. Для испытания автор отобрал 13 популярных инструментов — от передовых языковых моделей до специализированных корректорских сервисов.
...В блоке команды чат-бота BotHub на портале...
...Методология Автор стремился выжать из ИИ-корректоров...
Преподаватели Чувашского государственного университета им. И. Н. Ульянова разработали обучающие курсы чувашского языка на платформе Сбербанка Edutoria. Об этом 5 июля сообщила пресс-служба администрации главы республики. Курс «Чувашский язык» состоит из 13 лекций. Также на платформе можно пройти курс «История и культура Чувашии» — для тех, кто хочет ознакомиться с основными теориями происхождения чувашского народа, историей Чувашии, кто желает прикоснуться к ее ...
...Преподаватели Чувашского государственного университета...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Портал «Элементы» предлагает поломать голову над новыми задачами: проанализировать закономерности отражения праиндоевропейских звуков в славянских языках, выявить русские заимствования в польском и польские в русском среди слов, которые восходят к общему корню, а также перевести фразы с русского на язык маори и наоборот.
...Портал «Элементы» предлагает поломать голову...
...Язык из ниоткуда Задача от лингвиста Александра Пиперски...
Распознавание рукописных текстов — задача, где пересекаются лингвистика, история и машинное обучение. Как научить программу понимать сотни тысячи документов, созданных больше ста лет назад — да к тому же не всегда грамотными и аккуратными людьми? С этой задачей призвана справиться новая разработка специалистов Новосибирского государственного университета. Магистрант факультета информационных технологий НГУ Степан Гудков под руководством ...
...Распознавание рукописных текстов — задача...