Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Михаил Копотев о роли сгенерированных нейросетью текстов...
...Нейросети учатся на текстах, созданных человеком. Но...
...Должны ли существовать этические или юридические фильтры, если результат генерации отражает наш сообственный опыт, накопленный в текстах? Кому принадлежат авторские права на созданный текст? Автору промпта или создателю модели? Или им обоим?...
...Обучение и самообучение: как синтетические данные влияют...
Предлагаем вниманию читателей портала статью Александра Реформатского, опубликованную в журнале «Русский язык в школе» (№ 1, 1937). Из этой статьи читатель узнает, как в первые десятилетия советской власти шла работа по подготовке общеобязательного свода правил русского правописания, который, напомним, был официально утвержден только в 1956 году, почти через двадцать лет после написания статьи (работа по упорядочению правописания прервалась в годы Великой Отечественной войны).
...Александр Реформатский точно подметил болевые точки...
...Предлагаем вниманию читателей портала статью Александра...
...Как будто бы ясно, что именно в этом вопросе накопленный многими десятилетиями и отражающий в себе все этапы борьбы о и е разнобой нуждается в унификации. В каком же направлении она могла бы быть наиболее целесообразной? Прежде всего, следует разъяснить некоторые недоразумения. 1....
...Упорядочение русского правописания...
Русский драматург Александр Николаевич Островский был большим любителем народного слова и с интересом собирал незнакомые ему слова и выражения. Результатом его наблюдений за живой речью стали «Материалы для словаря русского народного языка». В 1993 году вышел основанный на этих материалах «Словарь к пьесам А. Н. Островского», который содержит историко-бытовой, историко-театральный и филологический комментарии. Борис Самойлович Шварцкопф подробно описал этот словарь нового типа в 1973 году, за двадцать лет до того, как он был опубликован.
...Борис Шварцкопф описывает энциклопедические и филологические...
...Русский драматург Александр Николаевич Островский был...
...Тем более что авторы словаря-комментария были блестящими знатоками быта — быта реального, исторического, литературного, театрального, и при создании словаря они опирались на богатейший опыт, накопленный в этом плане Кабинетом А. Н....
...О неизданном «Словаре к пьесам А. Н. Островского»...
На современном этапе развития российского общества особую актуальность приобретают проблемы государственно-правового регулирования языковых отношений в Российской Федерации. Для решения вопросов, связанных прежде всего с русским языком, как исполнительная, так и законодательная власть предпринимают определенные шаги, что также свидетельствует о том, что эта проблема существует.
...При разработке закона о языке был учтен советский,...
...На современном этапе развития российского общества...
...При написании законопроекта был учтен опыт, накопленный при создании закона РСФСР «О языках народов РСФСР» и федерального закона «О внесении изменений и дополнений в закон РСФСР „О языках народов РСФСР“», о которых говорилось выше...
...Русский язык в российском законодательстве...
Когда ребенок русскоязычных родителей рождается вне России и оказывается в ситуации двуязычия, где лингвистическое внимание малыша распределяется между двумя и более языками, русский язык оказывается скорее «домашним» языком, нежели общеупотребительным. В этом случае русский язык может сохраниться как родной лишь при том условии, что он наполнится необходимым дополнительным личностным содержанием.
...На что опираться, чтобы сохранить язык у детей, если...
...Когда ребенок русскоязычных родителей рождается вне...
...Для свободного владения языком мало просто понимать...
...Как поэтическая речь влияет на формирование родного...
На нашей планете тысячи языков. Они относятся к разным языковым группам и семьям, а диалекты внутри них могут отличаться настолько сильно, что специалисты спорят, не стоит ли их считать отдельными языками. Почему это многообразие нас так завораживает? Возможно, одну из причин назвал Петр Вяземский: «Язык есть исповедь народа: в нем чудится его природа, его душа и быт родной».
...Пять современных книг о словах и смыслах...
...На нашей планете тысячи языков. Они относятся к разным...
...Мы выбрали для вас несколько книг об историческом развитии...
...Почему языки такие разные...
Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.
...Умный поиск, обновленная Справка и текстовый робот-ассистент...
...Сервисы обновленной Грамоты становятся более технологичными...
...Грамота: Что изменится для пользователей в результате...
...Как искусственный интеллект изменит возможности Грамоты...
Чужой опыт, рекомендации придерживаться определенных правил вряд ли могут сыграть решающую роль в такой свободолюбивой среде, как Глобальная Сеть. И все же наблюдение за процессом рождения правил поведения в интернете, которые заметно отличаются от этикета внесетевой реальности и уже даже получили специальное название — Netiquette, не только представляет академический интерес для лингвистов и культурологов, но и является важным с практической точки зрения.
...В Сети границы между жанрами зачастую мягче и подвижнее...
...Чужой опыт, рекомендации придерживаться определенных...
...Ребенок воспитывался без родителей один, в интернете...
...А поговорить? Интернет как лингвистический феномен...
К шестидесятилетию «Орфографического словаря русского языка» предлагаем вашему вниманию публикацию, рассказывающую об истории одного написания, которое кажется нам сейчас привычным и единственно возможным, а 80 лет назад считалось ошибочным. Это написание «плавучий».
...К шестидесятилетию «Орфографического словаря русского...
...К шестидесятилетию «Орфографического словаря...
...Предисловие «Грамоты.ру» 25...
...Плавучий или пловучий?...
Соглашаясь с необходимостью законодательного регулирования вопросов, связанных с государственным языком, лингвисты обращают внимание на необходимость уточнения положений закона о государственном языке РФ. Некоторые из них называют отправленный на доработку закон антинаучным, дилетантским и антижурналистским, другие принципиально выступают против законодательного регулирования словоупотребления.
...Мнения лингвистов по поводу закона о государственном...
...Соглашаясь с необходимостью законодательного регулирования...
...Текст закона требует уточнений Юрий Караулов ...
...Притча во языцех...