%EF%EE%EB%E8%F0%EE%EB%FC | Журнал | Поиск по Грамоте

Прогноз: текстовые данные для обучения нейросетей могут закончиться в ближайшие годы

В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...

...В течение многих лет такие компании, как OpenAI...

Какие слова больше всего раздражают россиян на работе

Исследование, проведенное на платформе онлайн-рекрутинга hh.ru, показало, что среди слов и фраз, которые вызывают наибольшее раздражение, лидируют уменьшительно-ласкательные формы, такие как человечек и задачка. На втором месте по частоте упоминания — слово засинкаться, а также родственные ему синк и синкануться (от англ. synchronization ‘синхронизация’ в значении ‘встреча, позволяющая синхронизировать работу команды’). Эти слова упомянули 21% ...

...Исследование, проведенное на платформе онлайн-рекрутинга...

В России создали систему распознавания речи для диалекта карельского языка

Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) завершили разработку уникальной системы распознавания речи для ливвиковского наречия карельского языка, сообщает ТАСС. По данным ученых, в мире на карельском говорят около 30 тысяч человек, из которых 25 тысяч живут в России. При этом в повседневном общении его используют лишь 5–7 тысяч носителей. «Изучение карельского имеет огромное значение не только для сохранения культурного ...

...Специалисты Санкт-Петербургского федерального исследовательского...

Просодия образует отдельную знаковую систему, похожую на язык

Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...

...Системы распознавания речи работают с последовательностью...

Шаль, платок и полушалок...

Согласно словарю Ожегова шаль — это тоже платок, только большой. Допустимо ли говорить «платки и шали»? Разобраться поможет публикация в журнале «Наука и жизнь».

...Согласно словарю Ожегова шаль — это тоже платок...

...Слово шаль заимствовано в XVIII веке из польского (...

Министерство просвещения утвердило правила проверки знания русского языка

Министерство просвещения опубликовало приказ, который регламентирует порядок прохождения тестирования по русскому языку для детей из семей мигрантов из других стран. Ребенка, не прошедшего тестирование, не примут в школу — закон об этом вступит в силу 1 апреля 2025 года. Для успешной сдачи теста нужно будет набрать минимум три балла — аналог школьной «тройки», поясняет ТАСС со ссылкой на пресс-службу Рособрнадзора. Требования будут адаптированы под разные ...

...Министерство просвещения опубликовало приказ,...

Языковые модели хуже обрабатывают середину текста

Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...

...Исследователи из Массачусетского технологического...

Бессмысленные названия брендов оказались привлекательнее понятных

Могут ли слова, лишенные явного смысла, вызывать интерес сами по себе? В случае коммерческих названий, как выяснила международная команда специалистов, это возможно. Для начала они решили узнать, как названия влияют на успех кампаний на платформе Kickstarter. Любой желающий может представить свой проект на этой платформе и объявить сбор пожертвований на его реализацию. Авторы изучили 6487 проектов, сопоставив их названия с данными о собранном ...

...Могут ли слова, лишенные явного смысла, вызывать...

Ябедник «в погонах» и пожелание удавиться — чем запомнились послания, найденные в 2024 году

Алексей Гиппиус — доктор филологических наук, академик РАН, ученик Андрея Анатольевича Зализняка — прочитал две лекции в Высшей школе экономики по итогам раскопок берестяных грамот. Первая состоялась 18-го, вторая — 25 ноября.

...Алексей Гиппиус — доктор филологических...

...Всего в 2024 году найдено 57 грамот&...

Чем сгенерированные тексты отличаются от написанных человеком

Всё чаще можно слышать, что большие языковые модели вроде ChatGPT «пишут как люди». На первый взгляд их способность имитировать нашу речь действительно потрясает. Но более пристальный научный анализ все же выявляет различия. Научная группа из Университета Карнеги — Меллона (США) проверила с помощью методов корпусного анализа, насколько созданные человеком тексты отличаются от текстов в тех же жанрах и стилях, но созданных языковыми моделями (LLM).

...Всё чаще можно слышать, что большие языковые модели...

Почитать на грамоте