Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Разными исследователями, как нашими, так и зарубежными, неоднократно отмечалось, что дети, осваивающие какой-либо язык как родной (первый), и носители другого языка (инофоны), осваивающие тот же язык как второй, иногда допускают сходные ошибки, что, по-видимому, должно свидетельствовать о том, что стратегия построения первичной и вторичной языковой системы в определенном смысле совпадает. Однако, когда сопоставляются достаточно большие корпусы ошибок, это не подтверждается: среди ошибок, допускаемых инофонами, можно обнаружить некоторое количество «детских», но дети обычно не допускают ошибки, свойственные инофонам. Таким образом, можно говорить о несовпадении стратегий усвоения языка.
...Разными исследователями, как нашими, так и зарубежными...
...В качестве хорошо известных фактов можно привести правила...
В новом номере журнала «Русская речь» нас особенно заинтересовали статьи об искусственном интеллекте в медиа, о словообразовательной модели глаголов типа вслушаться и об изразцовых подписях XVIII века.
...В новом номере журнала «Русская речь...
...Язык в цифровую эпоху Искусственный интеллект...
Откуда у слов «липа» и «липовый» появилось значение «нечто фиктивное, подложное»? Отвечает журнал «Наука и жизнь».
...Откуда у слов «липа» и «липовый»...
...Негативная коннотация у слов липа и липовый связана...
Лингвистика, как и почти всякая другая наука, существует не только в себе и для себя: она призвана распространять достигнутые ею результаты вовне — в среду неспециалистов, которые заняты иными, далекими от науки делами: варят сталь, водят поезда, пашут землю... Многим из них, однако, небезразличны судьбы родного языка и особенности языковой жизни общества. Информация же об этом в доступных средствах информации весьма случайна и скудна.
...Лингвистика, как и почти всякая другая наука, существует...
...Лишь время от времени мы можем прочитать в газете или...
В новом номере журнала среди прочих тем обсуждаются отглагольные существительные в русских говорах, язык личных писем первой жены Петра I Евдокии Лопухиной и правила пунктуационного оформления определительных оборотов в препозиции.
...В новом номере журнала среди прочих тем обсуждаются...
...Диалектные слова для взяточников и взяткодателей...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Академик Виктор Владимирович Виноградов одним из первых разработал принципы филологического жанра «история слов». В его книге, которая так и называется «История слов», рассказано, как произошли те или иные слова, каково было их этимологическое значение, как изменялись значения и форма слов, как они использовались в классической литературе и в современных произведениях.
...Академик Виктор Владимирович Виноградов одним из первых...
...Чрезвычайно интересно проследить историю слова речь...
Даже тот, кто не посвятил жизнь науке, сталкивается с текстами, написанными в научном стиле. Любой реферат или доклад, учебник или научно-популярный блог использует особые языковые средства, которые отвечают его задачам. Текст в этом функциональном стиле не просто передает информацию, но стремится доказать ее истинность, ценность, а во многих случаях и новизну.
...Даже тот, кто не посвятил жизнь науке, сталкивается...
...Три подстиля для разных задач Традиционно выделяют...
Коммуникативный запрет — это не «стоп-лист», а добровольный отказ от той или иной модели речевого поведения. Таково видение обсуждаемой проблемы Владимира Ильича Карасика, доктора филологических наук, профессора кафедры общего и русского языкознания Института Пушкина. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...Коммуникативный запрет — это не «стоп-лист...
...Один из известнейших дискурсологов Владимир Карасик...