Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) завершили разработку уникальной системы распознавания речи для ливвиковского наречия карельского языка, сообщает ТАСС. По данным ученых, в мире на карельском говорят около 30 тысяч человек, из которых 25 тысяч живут в России. При этом в повседневном общении его используют лишь 5–7 тысяч носителей. «Изучение карельского имеет огромное значение не только для сохранения культурного ...
...Специалисты Санкт-Петербургского федерального исследовательского...
Международное исследование выявило прямую зависимость между прозрачностью календарных наименований в языке и тем, насколько хорошо носители языка справляются с вычислением дат и сроков. Авторы новой работы сравнили непрозрачные и прозрачные системы. В непрозрачных названия дней и месяцев не имеют явной связи с их порядком (например, в английском — Tuesday, August). В прозрачных системах (например, в китайском) дни и месяцы часто обозначаются цифрами: вторник как день-2, а август как ...
...Международное исследование выявило прямую зависимость...
Современные программы, которые генерируют тексты, научились писать довольно складно. Однако они часто спотыкаются именно на сложных правилах русского языка, поскольку в материалах, на которых их обучают, примеров применения таких правил крайне мало. Исследователи из МГУ и «Яндекса» разработали специальный учебный материал, призванный помочь программам лучше понимать и применять правила орфографии и пунктуации. Речь идет о самых трудных ...
...Современные программы, которые генерируют тексты, научились...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Перед вами третье задание конкурса, в котором есть задачки попроще и посложнее.
...Перед вами третье задание конкурса, в котором есть...
...Задания попроще 1. Буквомешалки Смешав и переставив...
Тематическая площадка «Язык и общество» Всероссийского фестиваля «НАУКА 0+» будет работать в Москве с 9 по 12 октября 2024 года на базе Московского государственного лингвистического университета (МГЛУ). 9 октября в 15:30 пройдет лекция доктора наук, профессора РАН Светланы Бурлак «Язык с точки зрения его происхождения». Из нее можно будет узнать, почему уникальные свойства языка не могли появиться в
...Тематическая площадка «Язык и общество»...
Александр Александрович Реформатский вошел в историю отечественной лингвистики прежде всего как автор неоднократно переиздававшегося учебника для филологических вузов «Введение в языковедение». Но ему принадлежит и ряд других трудов, оставивших заметный след в науке о языке. В памяти же современников, его коллег и учеников он остался как необыкновенно колоритная и своеобразная личность, как человек, производивший на собеседников яркое впечатление не только всем своим обликом и манерой поведения, но и своей речью.
...Александр Александрович Реформатский вошел в историю...
...«А ведь так, как говорит Реформатский, не говорит...
В блоке команды чат-бота BotHub на портале «Хабр» вышла статья о том, может ли машинный интеллект находить и исправлять ошибки в русскоязычном тексте, как настоящий корректор. Для испытания автор отобрал 13 популярных инструментов — от передовых языковых моделей до специализированных корректорских сервисов.
...В блоке команды чат-бота BotHub на портале...
...Методология Автор стремился выжать из ИИ-корректоров...
В декабре 2024 года исследовательская команда по ответственному использованию искусственного интеллекта (Responsible AI Team) корпорации BBC протестировала четыре популярных ИИ-помощника с опцией поиска информации в интернете — ChatGPT (OpenAI), Copilot (Microsoft), Gemini (Google) и Perplexity. Каждому ИИ-помощнику было задано по 100 вопросов, основанных на популярных темах запросов пользователей из Великобритании за последний год. Например, «Вреден ли вейпинг для ...
...В декабре 2024 года исследовательская команда по ответственному...