Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Полвека назад все было просто и понятно: вот писатель, вот журналист, а вот — редактор. В начале XXI века все запуталось: появились копирайтеры, райтеры, блогеры и контент-менеджеры. И немедленно вступили в переписку друг с другом и с заказчиками. Это подборка о современных принципах работы с текстами — мы включили в нее самые актуальные книги.
...Полвека назад все было просто и понятно: вот писатель...
...С появлением интернета изменился не только процесс...
Разными исследователями, как нашими, так и зарубежными, неоднократно отмечалось, что дети, осваивающие какой-либо язык как родной (первый), и носители другого языка (инофоны), осваивающие тот же язык как второй, иногда допускают сходные ошибки, что, по-видимому, должно свидетельствовать о том, что стратегия построения первичной и вторичной языковой системы в определенном смысле совпадает. Однако, когда сопоставляются достаточно большие корпусы ошибок, это не подтверждается: среди ошибок, допускаемых инофонами, можно обнаружить некоторое количество «детских», но дети обычно не допускают ошибки, свойственные инофонам. Таким образом, можно говорить о несовпадении стратегий усвоения языка.
...Разными исследователями, как нашими, так и зарубежными...
...В качестве хорошо известных фактов можно привести правила...
Хорошую речь во всех функциональных стилях, безусловно, могут продуцировать носители элитарной речевой культуры, поскольку они обладают истинным мастерством владения языком, всем его богатством при соблюдении всех правил и ограничений. К сожалению, чаще мы наблюдаем речь не носителей элитарной речевой культуры, а речь носителей среднелитературной речевой культуры, к которой принадлежит большинство лиц с высшим (даже специальным филологическим) образованием.
...Хорошую речь во всех функциональных стилях, безусловно...
...Среднелитературная речевая культура, напомним, отличается...
Недавно принятая в России Концепция государственной языковой политики призывает к защите русского языка от иностранных заимствований. До этого, в феврале 2023 года, были приняты поправки в закон «О государственном языке РФ», которые ограничивают использование англицизмов в рекламе. Россия — не единственная страна, чье правительство обеспокоено защитой своего языка от иностранного влияния. Такую же политику проводит и канадская ...
...Недавно принятая в России Концепция государственной...
Приятель брата — Митя или Дима? А новая коллега — Женя или Евгения? Анна Ивановна считает себя начальником или начальницей? Как описать соседа: он глухой или с нарушениями слуха? Во многих ситуациях нам приходится делать этот непростой выбор. На что лучше ориентироваться: на мнение того, о ком речь, на правила языка или на собственное удобство? Грамота расспросила об этом популяризатора лингвистики, кандидата филологических наук Александра Пиперски.
...Приятель брата — Митя или Дима? А новая...
...Выбор имени: родители, святцы и другие алгоритмы...
«Чем проще, тем лучше» — это правило действует во многих областях, в том числе в работе с текстами. Например, тяжелый слог юридических документов раздражает и профессиональных юристов, и их клиентов. Но, как выясняется, есть исключения. Когда речь идет о заголовках новостных статей, профессионалы и читатели не так единодушны в своих предпочтениях. Исследователи из США провели несколько экспериментов, чтобы выяснить это. Для ...
...«Чем проще, тем лучше» — это...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Может ли язык, используемый журналистами, повлиять на то, как будут восприниматься утверждения, вынесенные в заголовок новости? Очевидно, что может, поэтому заголовкам СМИ всегда уделяли много внимания. Оказалось, что для сообщений о научных фактах выбор слов тоже важен. Ученые давно знают? Ученые считают? Ученые уверены? Исследователи из Стэнфордского университета выяснили: выбор формулировки может существенно влиять на то, как читатель воспримет информацию: будет ли он ...
...Может ли язык, используемый журналистами, повлиять...
В августе внимание СМИ было приковано к Аляске как к месту российско-американского саммита. Как известно, в 1867 году российский император Александр II продал Аляску американцам, но там до сих пор живут люди, говорящие на особом диалекте русского языка. Русскоязычные жители Аляски тесно взаимодействовали с коренным населением, и местные индейцы переняли многие православные традиции. Об этом и многом другом лингвист Андрей Кибрик рассказал в интервью «Российской газете».
...В августе внимание СМИ было приковано к Аляске как...
...На Аляске около двадцати коренных языков, которые...