В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...Хотя глобально этот подход, может, и не решит...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...), что повысило его частоту в общей выборке (хотя...
В 2004 году во время раскопок в Умм-эль-Марре около Алеппо была найдена гробница с человеческими останками и другими предметами раннего бронзового века (2600–2150 годы до н. э.). Среди предметов оказались четыре глиняных цилиндра, каждый размером с палец, с выгравированными на них восемью различными символами. Археолог Гленн Шварц из Университета Джонса Хопкинса в Балтиморе (США), который был одним из руководителей раскопок, проанализировал ...
... Хотя символы не соответствуют никакому известному...
Статья научного консультанта Грамоты Владимира Пахомова в журнале «Неофилология» рассказывает о жизненном пути, научном и просветительском наследии Михаила Панова — лингвиста, педагога, популяризатора науки, в 1960-е годы — заместителя председателя Орфографической комиссии.
...Статья научного консультанта Грамоты Владимира Пахомова...
... Хотя сейчас общественная ситуация не благоприятствует...
В монгольском языке много слов, связанных с лошадьми, а в языке эскимосов — больше всего обозначений для снега? Такие убеждения можно встретить в подборках удивительных фактов о мире. Но часто их авторы не ссылаются ни на какие авторитетные источники, так что их утверждения приходится принимать на веру (или не принимать). Команда лингвистов и специалистов в области компьютерных наук из Мельбурнского университета (Австралия) и Калифорнийского университета в Беркли (США) решила ...
...Африке есть много терминов для обозначения дождя, хотя...
Орфографическая чувствительность — одно из уникальных человеческих свойств, связанное с восприятием письменной речи. Эта способность позволяет отличать не только слова от случайных наборов букв, но и правильно написанные слова от слов с ошибками. Чувствительность к орфографическому облику слова начинает формироваться обычно в младшем школьном возрасте, когда дети осваивают письмо. А в каком возрасте реакция на ошибки доводится до автоматизма? Это ...
...ответов в среднем было не более 14% — хотя...
Ежегодная лекция о новых находках состоялась 20 ноября 2023 года. Академик РАН Алексей Гиппиус, продолжая традицию, начатую его учителем, Андреем Анатольевичем Зализняком, рассказал о результатах раскопок прошедшего сезона: о пятнадцати новгородских грамотах и четырех грамотах из Старой Руссы. Трансляцию можно посмотреть на канале Института славяноведения РАН.
...Ежегодная лекция о новых находках состоялась 20 ноября...
...1158 мы видим слово приказъ в орфографии приказо, хотя...
Завершился очередной этап совершенствования инструментов, которыми можно пользоваться на Грамоте. Сегодня расскажем о самых заметных изменениях в том, что касается поиска. 1. Теперь на странице поиска есть тумблер, который позволяет переключаться между точным и умным поиском. По умолчанию ищется точное совпадение с тем запросом, который ввел пользователь в строке поиска: ровно те же знаки в том же порядке, без учета словоформ и похожих вариантов (тумблер ...
...знаков, но при этом в слове должны быть указаны хотя...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...оказались неожиданно подкованными в обмане, хотя...
Сложно организованные сообщества требуют сложных систем коммуникации. Хотя многие животные выработали свои способы обмена информацией, можно ли сказать, что хоть один из видов приблизился в этом к людям? Исследователи из Лаборатории искусственного интеллекта Массачусетского технологического института и международной инициативы CETI изучили вокализации (звуковые сигналы) кашалотов и пришли к выводу, что они похожи на настоящий язык. Авторы работы отталкивались от ...
...Хотя многие животные выработали свои способы обмена...