В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
11 февраля Госдума приняла в первом чтении законопроект «О внесении изменений в Федеральный закон “О государственном языке Российской Федерации” и отдельные законодательные акты Российской Федерации». Он вносит в законодательные акты поправки, касающиеся использования русского языка как государственного. Содержательно эти поправки можно обобщить следующим образом. Во-первых, постулируется, что «объединяющая роль в историческом сознании ...
...11 февраля Госдума приняла в первом чтении законопроект...
Азбука, буквица или букварь — это такой учебник, который позволяет запомнить написание печатных и рукописных букв. На выставке-калейдоскопе азбук «Не только буквы» в Доме культуры «ГЭС-2» прошла презентация книги «Азбукварь», в которой буквы русского алфавита представлены в стиле, похожем на сюрреализм.
...Азбука, буквица или букварь — это такой учебник...
...Родион Китаев — художник и иллюстратор, выпускник...
Исследование, проведенное на платформе онлайн-рекрутинга hh.ru, показало, что среди слов и фраз, которые вызывают наибольшее раздражение, лидируют уменьшительно-ласкательные формы, такие как человечек и задачка. На втором месте по частоте упоминания — слово засинкаться, а также родственные ему синк и синкануться (от англ. synchronization ‘синхронизация’ в значении ‘встреча, позволяющая синхронизировать работу команды’). Эти слова упомянули 21% ...
...Исследование, проведенное на платформе онлайн-рекрутинга...
Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) завершили разработку уникальной системы распознавания речи для ливвиковского наречия карельского языка, сообщает ТАСС. По данным ученых, в мире на карельском говорят около 30 тысяч человек, из которых 25 тысяч живут в России. При этом в повседневном общении его используют лишь 5–7 тысяч носителей. «Изучение карельского имеет огромное значение не только для сохранения культурного ...
...Специалисты Санкт-Петербургского федерального исследовательского...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...Системы распознавания речи работают с последовательностью...
Закон о защите русского языка был внесен в Госдуму еще в октябре 2023 года и вызвал бурное обсуждение. В первом варианте предлагалось ввести запрет на использование заимствованных слов вроде coffee или sale в названиях объектов, на вывесках, этикетках и даже в СМИ. Однако против таких ограничений возражали в предпринимательской среде: требование не использовать латиницу и переводить зарегистрированные иностранные названия могло вступать в противоречие с уже существующими правами на такие ...
...Закон о защите русского языка был внесен в Госдуму...
Международная группа математиков и историков из Великобритании и США представила систему искусственного интеллекта, способную восстанавливать частично утраченные надписи на латинском языке. Разработка, получившая название «Эней» (в честь легендарного героя Троянской войны), уже продемонстрировала высокую точность реконструкции — 90% успешных случаев. Об этом сообщает публикация в авторитетном научном журнале Nature. Для обучения ...
...Международная группа математиков и историков из...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Многие встречали утверждение, что мозг якобы игнорирует частицу не. Есть и другой взгляд: частица не меняет смысл слова на противоположный (не очень чистый — грязный), даже если это противоречит смыслу фразы. Благодаря новой работе исследователей из Нью-Йоркского университета появились дополнительные данные о восприятии отрицания. В серии экспериментов участники должны были читать прилагательные с отрицанием и без него (например, хороший —
...Многие встречали утверждение, что мозг якобы игнорирует...