В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Новое исследование, опубликованное в научном журнале Languages, утверждает: объем словарного запаса будущего партнера может быть фактором, определяющим перспективность отношений с ним. Исследователи проанализировали данные 83 двуязычных (английско-турецких) пар, состоящих в браке более 15 лет. Они были отобраны из более широкой выборки, использованной в предыдущем исследовании тех же авторов, посвященном изучению связей между словарным запасом родителей и
...Новое исследование, опубликованное в научном журнале...
У онлайн-платформы две цели: помочь мигрантам выучить на базовом уровне русский язык и подготовиться к приезду в Россию. Для этого на сайте есть раздел «Жизнь в России», где собрана информация о государственном устройстве, работе и деловой коммуникации, правах иностранцев (в частности, трудовых мигрантов), возможностях получить образование, а также о традициях, привычках и «культурном коде» жителей России. Проект реализован ...
...У онлайн-платформы две цели: помочь мигрантам выучить...
Исследование, проведенное на платформе онлайн-рекрутинга hh.ru, показало, что среди слов и фраз, которые вызывают наибольшее раздражение, лидируют уменьшительно-ласкательные формы, такие как человечек и задачка. На втором месте по частоте упоминания — слово засинкаться, а также родственные ему синк и синкануться (от англ. synchronization ‘синхронизация’ в значении ‘встреча, позволяющая синхронизировать работу команды’). Эти слова упомянули 21% ...
...Исследование, проведенное на платформе онлайн-рекрутинга...
Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) завершили разработку уникальной системы распознавания речи для ливвиковского наречия карельского языка, сообщает ТАСС. По данным ученых, в мире на карельском говорят около 30 тысяч человек, из которых 25 тысяч живут в России. При этом в повседневном общении его используют лишь 5–7 тысяч носителей. «Изучение карельского имеет огромное значение не только для сохранения культурного ...
...Специалисты Санкт-Петербургского федерального исследовательского...
Международная группа математиков и историков из Великобритании и США представила систему искусственного интеллекта, способную восстанавливать частично утраченные надписи на латинском языке. Разработка, получившая название «Эней» (в честь легендарного героя Троянской войны), уже продемонстрировала высокую точность реконструкции — 90% успешных случаев. Об этом сообщает публикация в авторитетном научном журнале Nature. Для обучения ...
...Международная группа математиков и историков из...
«Русский диктант» — это просветительская акция, задача которой — популяризация русского языка среди иностранных граждан и соотечественников за рубежом. Акция проходит уже не первый год; любой желающий может бесплатно принять в ней участие онлайн. Инициатива проведения принадлежит Балтийскому федеральному университету им. И. Канта. Диктант будет транслироваться 25 января в 14:00 по Калининграду (UTC+2). Чтобы стать ...
...«Русский диктант» — это просветительская...
«Золотая печатная машинка» Карстена Хенна вышла в 2025 году в издательстве «МИФ» в переводе литературоведа Марии Мисник. Эта сказочная история написана для детей и рассказывает о силе слова и о возможности контролировать реальность через текст.
...«Золотая печатная машинка» Карстена Хенна...
...Карстен Себастьян Хенн — немецкий писатель...
Баскский язык (эускара) десятилетиями считался белым пятном на лингвистической карте Европы. Окруженный романскими языками, он не имел известных родственников. Однако заполнить этот пробел могут находки, связанные с исчезнувшими народами Пиренейского полуострова. Группа исследователей под руководством палеолингвиста Эдуардо Ордуньи Аснара представила доказательства того, что у баскского был «родной брат» — древнеиберский язык. Иберы населяли восток и юг ...
...Баскский язык (эускара) десятилетиями считался белым...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...