Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Перевод инструкций для бытовой техники — хороший пример такого рода. Лет двадцать назад еще существовали технические переводчики, которые обладали уникальными знаниями: они знали названия всех частей стиральной машины....
...Сейчас эта работа полностью автоматизирована: она шаблонна, текстов такого рода очень много, а инструкций пользователи все равно не читают. В последние пару лет я редко пишу письма сам — чаще я говорю модели, что, в каком стиле и на каком языке ответить....
На презентации издания, которая состоялась 5 апреля на книжной ярмарке NonFiction, выступили историк, доктор исторических наук, профессор кафедры истории России до XIX века исторического факультета МГУ им. М. В. Ломоносова Антон Горский и лингвист, доктор филологических наук, ведущий научный сотрудник отдела языков народов Азии и Африки Института востоковедения РАН Светлана Бурлак.
...На презентации издания, которая состоялась 5 апреля...
...Вышло новое издание исследования «„Слово о полку Игореве...
... Правила такого рода касаются существительных и глаголов, морфологии и синтаксиса. Например, в системе форм XII века было двойственное число: в отличие от современного русского языка, два объекта обозначались не тем способом, как более чем два объекта....
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Состоялся запуск масштабного цифрового проекта «Слово...
...Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей....
Каждый день мы сталкиваемся с огромным количеством больших и маленьких текстов, но не всегда нам удается сразу осознать прочитанное. Что такое читательская грамотность и почему ее важно развивать? Грамота публикует статью нашего партнера, Всероссийского чемпионата сочинений «Своими словами», которая помогает увидеть сбои в логике, фантазии, преувеличения и неправомерные обобщения там, где при обычном чтении мы не замечаем ничего подозрительного.
...Каждый день мы сталкиваемся с огромным количеством...
...Критический взгляд на текст: как увидеть искажения...
...Иногда такого рода ошибки используют не ради смеха, а для введения в заблуждение тех, кто их не распознаёт. Таким образом действует большинство авторов фейковых новостей — одновременно обращаясь к механизмам когнитивных искажений и используя логические ошибки....
Живучесть словесных игр, переходящих из поколения в поколение, свидетельствует об их необходимости для умственного развития детей. Играя, они тренируют умение быстро вспоминать и точно употреблять нужные слова по заданным признакам, то есть активно владеть своим словарным багажом.
...Живучесть словесных игр, переходящих из поколения в...
...Чтобы добыть драгоценное слово…...
...После звонка оказалось, что школьники не пошли на перемену: они толпились у доски, продолжая увлеченно подбирать и записывать слова: банан, караван, Каштанка… Задания такого рода были введены в постоянный учебный обиход. Например, такие....
Александр Александрович Реформатский вошел в историю отечественной лингвистики прежде всего как автор неоднократно переиздававшегося учебника для филологических вузов «Введение в языковедение». Но ему принадлежит и ряд других трудов, оставивших заметный след в науке о языке. В памяти же современников, его коллег и учеников он остался как необыкновенно колоритная и своеобразная личность, как человек, производивший на собеседников яркое впечатление не только всем своим обликом и манерой поведения, но и своей речью.
...Александр Александрович Реформатский вошел в историю...
...К столетию со дня рождения Александра Александровича...
...рода — точка в конце предложения и прописная буква в начале следующего; см. изданную в 1933 году книгу А....
...лингвистического объяснения (такие объяснения читатель найдет в его статье 1955 года «Речь и музыка в пении»); из теории шахматной игры он заимствовал принцип избыточной защиты и использовал его при изучении структуры письменного текста — как принцип избыточной информации (пример избыточности такого...
Доктор филологических наук, член-корреспондент РАН, профессор УрФУ Елена Львовна Березович проанализировала около сорока анкет своих коллег-диалектологов из российских вузов и научных центров. О результатах этого опроса, отражающих современное состояние полевой диалектологии в России, она рассказала на конференции в Институте русского языка им. В. В. Виноградова РАН. Грамота законспектировала основные идеи выступления.
...Доктор филологических наук, член-корреспондент РАН,...
...Елена Березович: «Диалектологам становится все труднее...
... Приведу один пример такого рода, хотя можно было бы привести уже сотни. Есть довольно известный словарь И. И. Мосеева, который называется «Поморьска говоря»....
Говоря о выборе системы письма, мы не будем затрагивать вопросы исконного, если можно так выразиться, выбора: происхождения систем письма и формирования письменных ареалов. Далее будет говориться лишь о ситуации последних веков, включая современность.
...Говоря о выборе системы письма, мы не будем затрагивать...
...Факторы, влияющие на выбор системы письма...
...Однако такого рода различия, особенно различия между разными видами алфавитного письма, не следует преувеличивать. Даже недостатки арабского письма оказались преодолимы, что показали опыты создания реформированной арабицы в 20-е годы, например казахского алфавита Ахмета Байтурсунова....
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Национальный словарный фонд даст пользователям больше...
...С одной стороны, так мы проявляем уважение к авторам словарей: разделение слов на плохие и хорошие, литературные и нелитературные было бы вмешательством в авторскую ткань словаря, а словари в такого рода ресурсе должны подаваться аутентично....
Предлагаем вниманию читателей портала статью, опубликованную в журнале «Русский язык в школе» (№ 3, 1954). Чем отличаются друг от друга историзмы и архаизмы, в чем разница между лексическими и семантическими архаизмами? С какой целью их используют писатели? На эти вопросы отвечает Николай Максимович Шанский, с 1963-го по 2005 год — главный редактор журнала.
...Предлагаем вниманию читателей портала статью, опубликованную...
...Устаревшие слова в лексике современного русского литературного...
...С одной стороны, исследуя язык писателя прошлого, мы встречаемся с сознательным использованием такого рода фактов в определенных, указанных выше стилистических целях....
...К такого рода устаревшим словам можно отнести слова: конка, боярин, аршин, камер-юнкер, городовой, трактирщик, брадобрей, токмо (только), глаголать (говорить), зело (очень), живот (жизнь), вран (ворон) и др....
...Вот, например, некоторые архаизмы такого рода, наблюдаемые в романе Пушкина «Евгений Онегин»: соседственной, остановляет, покорствуя, кокетствуя, балтическим (ср. соседней, останавливает, покоряясь, кокетничая, балтийским)....