Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...
«Заметки на полях» — совместный проект Тотального диктанта и сервиса МТС «Строки». Научный руководитель Грамоты Владимир Пахомов ведет его вместе с писательницей Ириной Лейк. В первом выпуске ведущие обсудили интересные слова и выражения — как модные и современные, так и из лексикона Льва Толстого.
...«Заметки на полях» — совместный проект...
...Ведущие вспомнили школьные годы, когда они впервые...
Сравнение двух языковых моделей проводили методом Side-by-Side (букв. «бок о бок»). Обеим нейросетям предлагали один и тот же запрос, а затем эксперты выбирали лучший ответ вслепую (не зная, какой из сервисов его дал). Для эксперимента авторы брали обезличенные обращения пользователей продуктов «Яндекса» к нейросети YandexGPT 2. Выборка учитывала реальные потребности людей и охватила множество различных тем, сообщают в компании. По словам технического директора ...
...Сравнение двух языковых моделей проводили методом Side-by-Side...
Дети очень быстро начинают говорить на родном языке, при этом речь взрослых, обращенная к детям, часто бывает обеднена и упрощена. Исследователи обратили внимание на это противоречие и попробовали его объяснить. О том, что помогает ребенку понять устройство языка, доктор филологических наук, заведующая отделом теории грамматики ИЛИ РАН Мария Дмитриевна Воейкова рассказала в докладе «Вспомогательные механизмы языка и их роль в усвоении языка ребенком».
...Дети очень быстро начинают говорить на родном языке...
...Разговаривая с матерью, маленький ребенок получает...
Новая технология распознаёт речь в ролике и переводит ее на другой язык, сохраняя тембр голоса и движения губ. Статья в «Тинькофф Журнале» объясняет, как пользоваться HeyGen.
...Новая технология распознаёт речь в ролике и переводит...
...HeyGen разработана компанией OpenAI и изначально работала...
О начале разработки сообщил марийский лингвист, научный сотрудник Марийского института языка, литературы и истории Андрей Чемышев. Проекту уже дали название «iВика», созвучное с марийским женским именем Айвика. В целом набор функций цифрового помощника будет таким же, как у других подобных продуктов: он сможет найти информацию в интернете и зачитать ее, добавить встречу в календарь, включить песню, рассказать сказку или анекдот. Изюминка — в языке. Колонки с ...
...О начале разработки сообщил марийский лингвист, ...
2 июня, в преддверии книжного фестиваля «Красная площадь», на традиционном литературном обеде в Демонстрационном зале ГУМа были названы имена писателей, чьи произведения вошли в короткий список семнадцатого сезона национальной литературной премии «Большая книга». Об этом пишет сайт «Год литературы». Из 303 работ, выдвинутых на соискание премии в начале года, в длинный список вошли 49 произведений. Из них совет экспертов отобрал произведения 10 авторов. В финал ...
...2 июня, в преддверии книжного фестиваля «Красная...