В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...сгенерированных данных в итоге приводит к ее деградации...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...Причина такой деградации в том, что модель выбирает...
Открыл заседание президент России Владимир Путин. Он подчеркнул значимость усилий государства и общества в области поддержки русского и других языков России, высказал ряд конкретных предложений по совершенствованию этой работы. Завершая свое выступление, президент указал на необходимость «сформулировать базовые, стратегические цели и направления» языковой политики и «подготовить проект Основ государственной политики по этому направлению». В ходе ...
...МГЛУ Искра Космарская считает, что разговоры о деградации...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...синтетических текстовых данных, что может привести к их деградации...
...Это ведет к деградации модели: она хорошо работает...
Мы уже писали о том, какие блоги о языке можно найти в «Телеграме» и в социальных сетях. Но интересные источники лингвистических новостей и историй продолжают появляться, так что всегда есть что добавить к нашему списку. Представляем пять телеграм-каналов, авторы которых увлекательно и доступно рассказывают о тонкостях русского и других языков и рассматривают язык в разных контекстах — от географии до судебной экспертизы.
...Мы уже писали о том, какие блоги о языке...
...вопреки разговорам о его якобы порче и деградации...
С наличием в языке вариантов связано сразу несколько распространенных заблуждений. Считается, что в литературном языке не должно быть двух правильных вариантов одного и того же слова; наличие вариантов в словарях свидетельствует только о том, что лингвисты не могут договориться между собой; варианты в словарях — примета нашего времени, в изданиях прежних лет варианты не допускались. На самом деле вариантность — непременный атрибут литературного языка, а фиксация вариантов в словарях — неотъемлемая часть работы лингвистов-кодификаторов.
...С наличием в языке вариантов связано сразу несколько...
...следствие «вседозволенности» и «деградации...
...почти каждый раз, когда рассуждают о «деградации...
Николай Карамзин известен не только как историк, публицист и переводчик, но и как реформатор — нередко его называют одним из создателей современного русского языка. Деятельность Карамзина существенно повлияла на русскую литературу XIX века; многие привычные нам слова придумал или ввел в широкий оборот именно он. Каким был русский язык до Карамзина и как он его трансформировал?
...Николай Карамзин известен не только как историк, публицист...
...современный ему русский язык он считал результатом деградации...
Соглашаясь с необходимостью законодательного регулирования вопросов, связанных с государственным языком, лингвисты обращают внимание на необходимость уточнения положений закона о государственном языке РФ. Некоторые из них называют отправленный на доработку закон антинаучным, дилетантским и антижурналистским, другие принципиально выступают против законодательного регулирования словоупотребления.
...Соглашаясь с необходимостью законодательного регулирования...
...наука, наша русистика находится на этапе очевидной деградации...
Жители нашей планеты говорят на разных языках, но при этом постоянно друг с другом взаимодействуют. Потребность в общении и необходимость понимания породили такое интересное лингвистическое явление, как контактные языки. Как же общаются между собой носители взаимно непонятных языков?
...Жители нашей планеты говорят на разных языках, но при...
... С идеей примитивизации и деградации...
Совсем скоро выпускники будут сдавать ЕГЭ по русскому языку. Показывают ли результаты этого экзамена уровень знания предмета? Каких умений не хватает филологам-первокурсникам? Можно ли в школе научить не только грамотно писать, но и убедительно говорить? Об этом мы поговорили с экспертом Грамоты, кандидатом филологических наук, доцентом МПГУ Станиславом Викторовичем Ивановым.
...Совсем скоро выпускники будут сдавать ЕГЭ по русскому...
...А во владении языком никакой деградации нет, в...