Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Михаил Копотев о роли сгенерированных нейросетью текстов...
...Нейросети учатся на текстах, созданных человеком. Но...
...Сейчас большинство моделей создается бизнесом, индустрия заинтересована в развитии своих продуктов, а не в системах борьбы с ними — боюсь, эта задача внутри индустрии решится нескоро… Более простым вариантом может стать внешняя защита, например обязательная...
...Обучение и самообучение: как синтетические данные влияют...
Наши представления о Древней Руси во многом сформированы «Повестью временных лет», которая не всегда может служить достоверным историческим источником. Споры о роли скандинавов в создании древнерусского государства продолжались веками. Недостаток источников создал почву для развития псевдоисторических идей и любительской лингвистики. Но того, что известно исследователям, достаточно, чтобы проследить судьбу важных русских корней рус- и рос-.
...Как они возникли, почему раздвоились и при чем тут...
...Наши представления о Древней Руси во многом сформированы...
...Единственное отличие грецизмов — более высокий стиль. Можно вспомнить также поэтическую форму росс у Гавриила Державина: «Гром победы, раздавайся / Веселися, храбрый Росс!...
...Россия и Русь, россияне и русские: откуда пошли эти...
Сериал «Слово пацана», который активно обсуждают уже почти два месяца, заинтересовал нас не только словом «чушпан», которое даже называли в качестве кандидата на роль слова года. Насколько точно на экране передан сленг улицы в целом? Грамота поговорила об этом Шамилем Идиатуллиным, который в 1980-е годы жил в городе Брежнев (ныне Набережные Челны) и написал об этом времени книгу.
...Языковые реалии 1980-х по воспоминаниям жителя Татарстана...
...Сериал «Слово пацана», который активно...
...При этом все исходили из полного доверия друг другу: нельзя было стучать, ябедничать, откровенничать со старшими, с учителями, родителями, тем более с ментами. Это было категорически исключено....
...Классовая ненависть «Слово пацана» не сгущает краски, просто в сериале показана Казань, а не Брежнев, и более позднее время. От школы к школе, от района к району все сильно разнилось. Даже в соседних школах могло быть по-разному....
...Писатель Шамиль Идиатуллин: «Я был нормальный пацан...
У редакторов, которые работают в печатных и электронных медиа, часто нет ни журналистского, ни редакторского образования, но это не мешает им быть настоящими профессионалами. Заместитель главного редактора портала «Такие дела» Инна Кравченко рассказала Грамоте, что работать с фактурой, внимательно относиться к деталям и думать про драматургию текста она научилась на телевидении и в бизнес-изданиях, а еще в ГИТИСе и на сценарных курсах.
...Инна Кравченко объясняет в «Школе редакторского мастерства...
...У редакторов, которые работают в печатных и электронных...
...Все фандрайзинговые истории более или менее похожи, но я терпеть не могу, когда в социальной журналистике грубо выжимают слезу. Хороший автор понимает, как достичь доверия с героем, какие задавать вопросы, как вести беседу, чтобы не напугать....
...Как работает редактор в медиа? Избегает прилагательных...
Хорошую речь во всех функциональных стилях, безусловно, могут продуцировать носители элитарной речевой культуры, поскольку они обладают истинным мастерством владения языком, всем его богатством при соблюдении всех правил и ограничений. К сожалению, чаще мы наблюдаем речь не носителей элитарной речевой культуры, а речь носителей среднелитературной речевой культуры, к которой принадлежит большинство лиц с высшим (даже специальным филологическим) образованием.
...Для этого типа речевой культуры, в отличие от элитарной...
...Хорошую речь во всех функциональных стилях, безусловно...
...Среднелитературная речевая культура, напомним, отличается от элитарной и других более низких типов речевой культуры следующими признаками, которые образуют определенную систему....
... Васильева «Березовский меняет профессию» встретилось неуместное использование слова демарш: ...каждое следовавшее за первым его демаршем выступление отбрасывало «олигарха» во все более густую тень......
...Воспринимая эту статью как некролог, нельзя назвать ее хорошей, поскольку некролог этот написан в форме неуместного «стеба», который не может в данной ситуации восприниматься как хороший даже в близкодружеском общении, тем более в официальной речи....
...Тем более что в современной речи это сочетание приобретает черты устойчивого выражения. Кроме того, использование устаревшего значения приводит к неодинаковой трактовке фразы: то ли автор имел в виду промежуток времени начиная с 1985 года, то ли территорию бывшего СССР....
...Более важным признаком рассматриваемой речевой культуры является не только, даже не столько характерность для нее нарушений разнообразных норм и ограничений языка, но и нарушение и несоблюдение элементарных этических норм речи: нарушение этикетных правил, категоричность в высказываемых...
...Хорошая речь и среднелитературная речевая культура...
Если ребенку в младших классах трудно дается чтение, это может быть признаком дислексии. При этом ребенок вполне сможет научиться читать на уровне других детей, если родители рано обратят внимание на его затруднения и обратятся к специалистам. О том, как проявляется дислексия и какого прогресса удается достичь с помощью специальных упражнений, рассказывает лингвист, основатель детской онлайн-школы «Лаборатория чтения „Верные слова“» Анна Иосифовна Левинзон.
...Шансы бегло читать выше у тех, кто рано начал заниматься...
...Если ребенку в младших классах трудно дается чтение...
...Например, в слове вступил ребенок может услышать более отчетливо звук [с], а не [в]. Можно поиграть в такую игру: «принеси мне все предметы в комнате, которые начинаются со звука [р]»....
... Одна из заметных особенностей дислексии — неумение разделить поток речи на более мелкие единицы: текст — на предложения, предложения — на слова, слова — на слоги и звуки....
...Дети с дислексией: чем родители могут им помочь...
Самое базовое понятие лингвистики до сих пор не до конца осмыслено и требует дополнительных исследований. Некоторые ответы дает наблюдение за людьми, страдающими афазией, пишет в журнале «Наука и жизнь» доктор филологических наук Владимир Алпатов.
...В начале было слово, но лингвисты затрудняются дать...
...Самое базовое понятие лингвистики до сих пор не до...
...Изучение механизмов деятельности мозга только начинается, и новые данные могут помочь более глубоко осмыслить и другие важные для лингвистов понятия, такие как многозначность, омонимия, части речи....
...Ужели слово найдено?...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...Поздравляем наших партнеров и рассказываем об их успехах...
...Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно добавляются новые корпусы. Также НКРЯ — цифровой проект с удобным интерфейсом....
...Национальному корпусу русского языка исполняется 20...
Работа над расширением возможностей Грамоты продолжается. В последнее время были внесены некоторые изменения, которые делают общение с Грамотой более комфортным. 1. На главной странице Грамоты появился блок «Учебник». Теперь можно прямо отюда увидеть все правила, которые уже есть в Учебнике Грамоты, и перейти на интересующее пользователя интерактивное упражнение. 2. Для тех, кто использует интерактивные упражнения в бумажном виде, есть кнопка ...
...На главной странице появился блок Учебника, упражнения...
...В последнее время были внесены некоторые изменения, которые делают общение с Грамотой более комфортным. 1. На главной странице Грамоты появился блок «Учебник»....
...Такой внешний вид делает репост ссылок на Грамоту более удобным и красивым. 4. Если у нашего автора есть несколько публикаций в Журнале Грамоты, их можно увидеть, нажав на имя автора в конце любой его статьи....
...Дневник обновлений: рассылка Грамоты и другие новости...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Инструменты, разработанные сотрудниками ИЛИ РАН, будут...
...Благодя цифровизации науки многие полезные справочные...
...Словарь-справочник аффиксоидов русского языка В справочник включены более 900 начальных (префиксоиды) и финальных (суффиксоиды) частей сложных слов....
...Современные онлайн-ресурсы расширяют возможности исследователей...