В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
В 2004 году во время раскопок в Умм-эль-Марре около Алеппо была найдена гробница с человеческими останками и другими предметами раннего бронзового века (2600–2150 годы до н. э.). Среди предметов оказались четыре глиняных цилиндра, каждый размером с палец, с выгравированными на них восемью различными символами. Археолог Гленн Шварц из Университета Джонса Хопкинса в Балтиморе (США), который был одним из руководителей раскопок, проанализировал ...
...В 2004 году во время раскопок в Умм-эль-Марре...
Перед вами третье задание конкурса, в котором есть задачки попроще и посложнее.
...Перед вами третье задание конкурса, в котором есть...
...Задания попроще 1. Буквомешалки Смешав и переставив...
Существуют ли языковые способы мотивировать людей к действию — или эффект больше зависит от того, кто говорит, от настроения аудитории и качества аргументов? Исследователи из Университета социальных и гуманитарных наук в Варшаве и Падуанского университета нашли подтверждения первой гипотезы. На основе существующих представлений о том, как люди стремятся к целям, авторы предположили, что успешная мотивирующая коммуникация (в виде текста) ...
...Существуют ли языковые способы мотивировать людей к...
Международная группа исследователей обнаружила, что большие языковые модели, такие как ChatGPT, обрабатывают предложения почти так же, как человеческий мозг, — разбивая их на иерархически упорядоченные блоки-составляющие, а не просто анализируя цепочку слов. Классическая лингвистика со времен Ноама Хомского утверждает, что мозг превращает линейную последовательность слов в иерархическую структуру — дерево, где слова объединяются в группы ...
...Международная группа исследователей обнаружила, что...
Ориентация говорящего в мире устроена по-разному в разных культурах. В языках среднеевропейского типа человек находится в центре, а окружающее пространство описывается по отношению к нему через категории «слева» и «справа», «сзади» и «спереди». Но это далеко не единственный способ говорить о том, что нас окружает, засвидетельствованный в языках мира. О некоторых других ориентирах рассказывает лингвист Валерий Шульгинов.
...Ориентация говорящего в мире устроена по-разному в...
...К востоку от входа Носители русского языка воспринимают...
4 апреля в пресс-центре ТАСС состоялась пресс-конференция, посвященная созданию государственной информационной системы «Национальный словарный фонд». Это электронная информационная система с открытым доступом, имеющая разные модули, которая позволяет получить информацию как о текущем словарном составе русского языка, так и о его истории на протяжении почти трехсот лет. Минобрнауки выступает оператором и разработчиком проекта, работы над ним ведутся ...
...4 апреля в пресс-центре ТАСС состоялась пресс-конференция...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Сериал «Слово пацана», который активно обсуждают уже почти два месяца, заинтересовал нас не только словом «чушпан», которое даже называли в качестве кандидата на роль слова года. Насколько точно на экране передан сленг улицы в целом? Грамота поговорила об этом Шамилем Идиатуллиным, который в 1980-е годы жил в городе Брежнев (ныне Набережные Челны) и написал об этом времени книгу.
...Сериал «Слово пацана», который активно...
...В «Слове пацана» есть хорошая фактическая...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
...1. Новое в русской лексике База данных снабжена...