В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Исследование, проведенное на платформе онлайн-рекрутинга hh.ru, показало, что среди слов и фраз, которые вызывают наибольшее раздражение, лидируют уменьшительно-ласкательные формы, такие как человечек и задачка. На втором месте по частоте упоминания — слово засинкаться, а также родственные ему синк и синкануться (от англ. synchronization ‘синхронизация’ в значении ‘встреча, позволяющая синхронизировать работу команды’). Эти слова упомянули 21% ...
...Исследование, проведенное на платформе онлайн-рекрутинга...
Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) завершили разработку уникальной системы распознавания речи для ливвиковского наречия карельского языка, сообщает ТАСС. По данным ученых, в мире на карельском говорят около 30 тысяч человек, из которых 25 тысяч живут в России. При этом в повседневном общении его используют лишь 5–7 тысяч носителей. «Изучение карельского имеет огромное значение не только для сохранения культурного ...
...Специалисты Санкт-Петербургского федерального исследовательского...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...Системы распознавания речи работают с последовательностью...
Согласно словарю Ожегова шаль — это тоже платок, только большой. Допустимо ли говорить «платки и шали»? Разобраться поможет публикация в журнале «Наука и жизнь».
...Согласно словарю Ожегова шаль — это тоже платок...
...Слово шаль заимствовано в XVIII веке из польского (...
Министерство просвещения опубликовало приказ, который регламентирует порядок прохождения тестирования по русскому языку для детей из семей мигрантов из других стран. Ребенка, не прошедшего тестирование, не примут в школу — закон об этом вступит в силу 1 апреля 2025 года. Для успешной сдачи теста нужно будет набрать минимум три балла — аналог школьной «тройки», поясняет ТАСС со ссылкой на пресс-службу Рособрнадзора. Требования будут адаптированы под разные ...
...Министерство просвещения опубликовало приказ,...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Могут ли слова, лишенные явного смысла, вызывать интерес сами по себе? В случае коммерческих названий, как выяснила международная команда специалистов, это возможно. Для начала они решили узнать, как названия влияют на успех кампаний на платформе Kickstarter. Любой желающий может представить свой проект на этой платформе и объявить сбор пожертвований на его реализацию. Авторы изучили 6487 проектов, сопоставив их названия с данными о собранном ...
...Могут ли слова, лишенные явного смысла, вызывать...
Алексей Гиппиус — доктор филологических наук, академик РАН, ученик Андрея Анатольевича Зализняка — прочитал две лекции в Высшей школе экономики по итогам раскопок берестяных грамот. Первая состоялась 18-го, вторая — 25 ноября.
...Алексей Гиппиус — доктор филологических...
...Всего в 2024 году найдено 57 грамот&...
Всё чаще можно слышать, что большие языковые модели вроде ChatGPT «пишут как люди». На первый взгляд их способность имитировать нашу речь действительно потрясает. Но более пристальный научный анализ все же выявляет различия. Научная группа из Университета Карнеги — Меллона (США) проверила с помощью методов корпусного анализа, насколько созданные человеком тексты отличаются от текстов в тех же жанрах и стилях, но созданных языковыми моделями (LLM).
...Всё чаще можно слышать, что большие языковые модели...