В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Исследование, проведенное на платформе онлайн-рекрутинга hh.ru, показало, что среди слов и фраз, которые вызывают наибольшее раздражение, лидируют уменьшительно-ласкательные формы, такие как человечек и задачка. На втором месте по частоте упоминания — слово засинкаться, а также родственные ему синк и синкануться (от англ. synchronization ‘синхронизация’ в значении ‘встреча, позволяющая синхронизировать работу команды’). Эти слова упомянули 21% ...
...Исследование, проведенное на платформе онлайн-рекрутинга...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...Системы распознавания речи работают с последовательностью...
Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) завершили разработку уникальной системы распознавания речи для ливвиковского наречия карельского языка, сообщает ТАСС. По данным ученых, в мире на карельском говорят около 30 тысяч человек, из которых 25 тысяч живут в России. При этом в повседневном общении его используют лишь 5–7 тысяч носителей. «Изучение карельского имеет огромное значение не только для сохранения культурного ...
...Специалисты Санкт-Петербургского федерального исследовательского...
В разных контекстах Вильгельм фон Гумбольдт подчеркивал различные аспекты языка. Отсюда — его разные определения. В контексте же настоящей статьи для нас имеют главное значение два гумбольдтовских понимания языка — деятельностно-речевое («Язык есть деятельность») и системно-знаковое («Язык есть система знаков»). Из первого из них вытекает возможность проследить, в каком соотношении в учении Гумбольдта находятся семасиологизм и ономасиологизм, а из второго — в каком соотношении в нем представлены язык и речь.
...В разных контекстах Вильгельм фон Гумбольдт подчеркивал...
...В отличие от Фердинанда де Соссюра (1857&ndash...
Министерство просвещения опубликовало приказ, который регламентирует порядок прохождения тестирования по русскому языку для детей из семей мигрантов из других стран. Ребенка, не прошедшего тестирование, не примут в школу — закон об этом вступит в силу 1 апреля 2025 года. Для успешной сдачи теста нужно будет набрать минимум три балла — аналог школьной «тройки», поясняет ТАСС со ссылкой на пресс-службу Рособрнадзора. Требования будут адаптированы под разные ...
...Министерство просвещения опубликовало приказ,...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Могут ли слова, лишенные явного смысла, вызывать интерес сами по себе? В случае коммерческих названий, как выяснила международная команда специалистов, это возможно. Для начала они решили узнать, как названия влияют на успех кампаний на платформе Kickstarter. Любой желающий может представить свой проект на этой платформе и объявить сбор пожертвований на его реализацию. Авторы изучили 6487 проектов, сопоставив их названия с данными о собранном ...
...Могут ли слова, лишенные явного смысла, вызывать...
Хотя речь — основной способ передачи информации, в процессе общения существенную роль играют невербальные сигналы, в первую очередь жесты и мимика. Когда человек объясняет свою мысль, его руки могут рисовать в воздухе контуры, указывать на объекты или подчеркивать смысловые акценты — и это не случайность. Жесты нередко выдают истинные эмоции человека, их смысл может отличаться в разных культурах, а еще они сами по себе способны формировать знаковую систему.
...Хотя речь — основной способ передачи информации...
...Жесты у детей По разным оценкам, дети начинают...
Носители языка не всегда могут уследить за тем, что лингвисты тщательно фиксируют в словарях, правда, всегда с опозданием: одни слова вдруг появляются ниоткуда или становятся модными в силу ситуации, а другие постепенно выходят из употребления, устаревают и исчезают. У переводчика в этом отношении есть преимущество: он смотрит на чужой язык со стороны и более чувствителен к изменениям. Переводчик-японист Екатерина Тарасова рассказала Грамоте о новых явлениях в японском языке.
...Носители языка не всегда могут уследить за тем, что...
...В Японии очень внимательно относятся к неологизмам....