Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Одна из целей в обучении иностранному языку — помочь студенту понимать живую речь носителей. Здесь может быть полезен просмотр видео — не только обучающих фрагментов, но и любимых сериалов или фильмов. Вопрос в том, включать ли при этом субтитры на языке оригинала. Один подход заключается в том, чтобы смотреть запись без вспомогательных инструментов, в расчете на то, что студент научится различать знакомые слова на слух и по контексту ...
...Одна из целей в обучении иностранному языку ...
«Чем проще, тем лучше» — это правило действует во многих областях, в том числе в работе с текстами. Например, тяжелый слог юридических документов раздражает и профессиональных юристов, и их клиентов. Но, как выясняется, есть исключения. Когда речь идет о заголовках новостных статей, профессионалы и читатели не так единодушны в своих предпочтениях. Исследователи из США провели несколько экспериментов, чтобы выяснить это. Для ...
...«Чем проще, тем лучше» — это...
В современном русском языке принято выделять шесть падежей, но в интернете периодически возникают дискуссии по поводу их количества — особо смелые авторы увеличивают число вдвое. Лингвист Алексей Лебедев в статье для журнала «Наука и жизнь» показывает, что почти все якобы исчезнувшие падежи можно считать либо частными случаями основных шести, либо особыми формами слов.
...В современном русском языке принято выделять шесть...
...В древнерусском языке действительно было больше...
Статья научного консультанта Грамоты Владимира Пахомова в журнале «Неофилология» рассказывает о жизненном пути, научном и просветительском наследии Михаила Панова — лингвиста, педагога, популяризатора науки, в 1960-е годы — заместителя председателя Орфографической комиссии.
...Статья научного консультанта Грамоты Владимира Пахомова...
...Реформа русской орфографии, которая готовилась в ...
Любители словарных игр просят специалистов разобраться в вопросе о торговых названиях: являются ли они именами собственными (и, следовательно, в игру не принимаются) или нарицательными (и тогда имеют право на жизнь)? Им отвечает доктор филологических наук, специалист по терминологии Владимир Моисеевич Лейчик.
...Любители словарных игр просят специалистов разобраться...
...Уважаемые господа! Помогите вконец запутавшимся любителям...
Считается, что современная молодежь стала меньше читать, но это иллюзия. Разница между поколениями состоит не в том, что молодые люди читают меньше (они читают, и немало), а в том, что они читают другое.
...Считается, что современная молодежь стала меньше читать...
...Молодые люди сегодня почти не читают художественной...
Номер посвящен русскому языку в мире и выходит в год, объявленный СНГ Годом русского языка как языка межнационального общения. В него вошли статьи о теоретических проблемах социолингвистики, о положении русского языка в России и в мире, о языках народов России и т. д. Выпуск доступен на сайте журнала.
...Номер посвящен русскому языку в мире и выходит в год...
...Номер открывается статьей главного редактора журнала...
Про русский язык сегодня известно очень много. Чтобы сделать в русистике что-то действительно новое, хорошо бы посмотреть на описание языка радикально иначе. Такой взгляд со стороны типологии, как мне кажется, может быть продуктивным.
...Про русский язык сегодня известно очень много. Чтобы...
...Я хоть и работаю в Институте русского языка давно и...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...