Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Изначально этот текст, написанный лет десять назад и называвшийся «Заметки графофила», имел ограниченное хождение среди моих друзей и знакомых. Позднее бóльшая его часть под заголовком «„И пучину взворотила и поставила вверх дном“? (заметки об авторской пунктуации)» была опубликована в газете «Русский язык» (№ 7 за 2002 год). Сокращения коснулись отступления про «авторскую орфографию», а также материалов, найденных в интернете. Авторская орфография заслуживает отдельного обстоятельного разбора, текстов из интернета я и сейчас тоже почти не касаюсь.
...Изначально этот текст, написанный лет десять назад...
...За прошедшие десять лет интернет вырос многократно,...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
Доктор филологических наук Александра Суперанская рассказывает в журнале «Наука и жизнь» об этимологии некоторых русских фамилий.
...Доктор филологических наук Александра Суперанская рассказывает...
...Часто людям интересно происхождение собственной фамилии...
В справочную службу Грамоты пишет недоумевающий пользователь: «...Меня резко поправили, когда я спросила „кто последний“ (в очереди), сказали, что в русском языке так говорить не принято, а нужно „кто крайний“». На самом деле все как раз наоборот. Неправильно спрашивать в очереди «кто крайний» и не стоит, предлагая гостю сесть, говорить «присаживайтесь» (грамотно «садитесь»).
...В справочную службу Грамоты пишет недоумевающий...
...Мы не случайно объединили два этих мифа в один...
Идея панславизма захватила умы в XIX веке на волне национальных движений. Но мысль о необходимости преодолеть религиозное и языковое разобщение славян зародилась гораздо раньше. Еще в XVII веке хорватский богослов, философ, лингвист и историк Юрий Крижанич попытался создать единый славянский язык.
...Идея панславизма захватила умы в XIX веке на ...
...Славянский полиглот Юрий Крижанич родился в 1618...
Цифровая коммуникация регулируется множеством неформальных правил, которые возникают на наших глазах. Мы обсуждаем время отправки сообщений, скорость реакции на них, уместность эмодзи, стикеров и скобочек, но самую важную роль играют слова. Рассказать о словесных кодах рабочих чатов Грамоте помогла Ольга Лукинова — эксперт по цифровым коммуникациям, автор телеграм-канала «Цифровой этикет».
...Цифровая коммуникация регулируется множеством неформальных...
...Чужой монастырь и корпоративная культура Цифровой...
Нам трудно себе это представить, но зимние праздники еще двести лет назад выглядели совсем не так, как сегодня. И не только потому, что главным было Рождество, но и потому, что никаких новогодних и рождественских елок во времена Пушкина еще не было. Мы решили разобраться, как появилось в России главное новогоднее слово и какими еще словами сопровождается встреча Нового года.
...Нам трудно себе это представить, но зимние праздники...
...Святки, Рождество, Новый год Впервые елку на рождественские...
Проблемы, которые мы здесь обсуждаем, в конечном итоге сводятся к оценке состояния русского языка, и зеркалом этого состояния является язык средств массовой информации. Само слово «состояние» заряжено негативной оценкой, предполагает какие-то дефекты в предмете. Ср. «состояние больного внушает опасения», «состояние конструкции здания чревато опасностями» и т. п. Но когда мы говорим о состоянии языка, мы разве озабочены разрушением его морфологического строя? Или нас настораживают изменения в его фонетике, в его синтаксисе?
...Проблемы, которые мы здесь обсуждаем, в конечном итоге...
...Нет, структурная его организация вполне благополучна...
«Зубодробительный», «заумный», «трескучий» — так говорят про язык законов, инструкций, договоров и соглашений. Мы привыкли мириться с ним, раз «так нужно». Но государство и бизнес наконец сами задумались о том, чтобы говорить проще. Какие есть инструменты, которые им в этом помогут?
...«Зубодробительный», «заумный»...
...Какой язык называют простым Простой язык (plain language...