Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Вряд ли мы остановим поток искусственно созданных текстов, который льется в Сеть. М. К.: Это еще одна острая задача, над которой работают компьютерные лингвисты, но здесь хороших решений я пока не вижу....
Что за напасть? Почему столько иностранных слов почти в каждом предложении, печатном или произнесенном в радио- и телеэфире? Зачем нам имидж, если есть образ, к чему саммит, если можно сказать «встреча в верхах»? Чем модный нынче в кинематографии римейк лучше обычной переделки? И разве консенсус прочнее согласия?
...Что за напасть? Почему столько иностранных слов почти...
...Иноязычие в нашей речи — мода или необходимость?...
...Вряд ли издавались указы, предписывавшие эти слова изгнать из русской речи, — они устарели, вытеснились сами собой как нечто ненужное....
Слова, у которых изменилось написание, выбор между «слитно» и «раздельно», новые или разговорные слова, которых еще нет в словарях, — все это сложные случаи, которые могут вызвать затруднения даже у очень грамотных кандидатов филологических наук. Давайте познакомимся поближе с этими опасными экземплярами.
...Слова, у которых изменилось написание, выбор между...
...Слова Шрёдингера и как с ними справляться...
...Если приходится писать или редактировать текст о животных, растениях, минералах, трофейной охоте, в обычных словарях нужные слова вряд ли найдутся. Лучше поискать их в специальных словарях, справочниках и энциклопедиях....
Я точно помню дату, когда чаша моего, так сказать, филологического терпения переполнилась: это произошло 23 декабря 1992 года. Утром я услышал из уст диктора российского радио примерно следующее: «Но основная выгода власть предержащих — это отсутствие свободы слова, гласности». А вечером того же дня симпатичный ведущий «Вестей» с обаятельной улыбкой заявил с телеэкрана: «Впрочем, баланс интересов прессы и власть предержащих возможен».
...Я точно помню дату, когда чаша моего, так сказать,...
...И еще раз о властях предержащих, или Что такое крылатые...
...Вряд ли нужно доказывать, что непрофессионализм и элементарная неграмотность несовместимы со статусом серьезного издания, на который претендует ваша газета». Редакция газеты ответила, что она «принимает замечания к сведению и приносит извинения читателям»....
...Так что все же вряд ли выражение властемъ высшим древнерусский читатель середины XIV века (время перевода Алексия) понял бы как-либо превратно. Более интересен другой вопрос: почему Алексий употребил форму предержащимъ вместо использовавшейся ранее формы превладающимъ (превладущиимъ)....
В самом конце 2006 года, а затем несколькими тиражами в 2007 году опубликована книга «Правила русской орфографии и пунктуации. Полный академический справочник» (М.: Эксмо). Справочник издан под грифом Российской академии наук и одобрен Орфографической комиссией РАН.
...В самом конце 2006 года, а затем несколькими тиражами...
...Новый академический справочник по русскому языку...
...Таким образом, очень незначительные орфографические изменения вряд ли могут считаться «реформой русского письма», как иногда пишут журналисты. Вернувшись к вопросу о полноте нового справочника, отмечу, что в нем содержится ряд разделов, отсутствовавших в Правилах 1956 года....
На портале для киноманов IndieWire вышла статья «Сконструированные языки не всегда добираются до финальной версии фильмов, но „Дюна: часть вторая“ показывает, почему они должны там быть». Дэвид Питерсон, известный как создатель дотракийского и валирийского языков для сериала «Игра престолов», и его жена и коллега Джесси рассказали изданию о своей работе над чакобса, языком фрименов. Грамота публикует перевод этой статьи.
...На портале для киноманов IndieWire вышла статья «...
...Как лингвисты придумали колоритный конланг для фильма...
...Поэтому если Дени Вильневу удастся осуществить свое намерение и снять третью часть фильма, то чакобса вряд ли уйдет в песок. Литература Иванова Д. Конланги, артланги, ауксланги или просто искусственные языки // Lingva....
Появление интернета как общедоступного пространства общения породило новое языковое разделение. Язык блогов, форумов и соцсетей, не скованный литературными и типографскими нормами, теперь существует параллельно с языком традиционных СМИ. Но граница между ними проницаема: медиа и сами живут на территории интернета, а «зумерский» сленг и новые понятия легко проникают в серьезные газеты и журналы.
...Появление интернета как общедоступного пространства...
...Хайп, кринж и краш на всю страну: зачем медиа используют...
...Язык традиционных СМИ, на который распространяются в том числе и законодательные ограничения, и более раскованный соцсетевой стиль вряд ли когда-нибудь сольются в нечто единое. Слишком отличаются их роли....
Когда носитель русского языка оказывается в Болгарии, то невольно удивляется: «А почему тут все написано нашими буквами?» Хотя мы и привыкли воспринимать русский алфавит как нечто родное, те же болгары стали использовать кириллические буквы раньше нас. Когда и зачем возникла кириллица, кто разработал новый алфавит и как он связан с глаголицей, латиницей и греческим алфавитом?
...Когда носитель русского языка оказывается в Болгарии...
...Два брата и два алфавита: история изобретения славянской...
...Вряд ли более простое письмо оказалось бы заменено более сложным. Позднее сторонники древности глаголицы получили подтверждение своей правоты: в некоторых памятниках кириллический текст написан поверх стертого глаголического....
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Как современные технологии помогают оценить сложность...
...Не все показатели мы выводим на экран: пользователю вряд ли интересно, какая доля существительных в родительном падеже есть в его тексте, но для алгоритма это важно....
О реформах русского языка до революции и в советское время и о том, почему необходим общеобязательный свод правил, рассказывает доктор филологических наук Владимир Лопатин.
...О реформах русского языка до революции и в советское...
...Из истории реформирования русского правописания...
...Вряд ли верной уже изначально была рекомендация «Правил» писать строчными буквами звуковые аббревиатуры, «обозначающие имена нарицательные»....