Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Латинский язык нельзя назвать мертвым в той же мере, что древнеегипетский, хеттский или даже древнегреческий. Традиция преподавания латинского языка непрерывна и восходит к средневековым университетам; его до сих пор изучают историки, юристы, богословы, медики. Но уйти в прошлое ему не дают главным образом филологи-классики и многочисленные энтузиасты, которые до сих пор используют его для живого общения.
...Латинский язык нельзя назвать мертвым в той же...
...Где он живет Чтобы язык считался хоть сколько-нибудь...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
Английский термин Tone of Voice (сокращенно ToV) обозначает ту интонацию, которую улавливает в тексте читатель. Этот термин пришел из маркетинга и сначала касался только бизнес-коммуникаций, голоса бренда. Затем он стал применяться к любым видам коммуникаций с аудиторией, в том числе и к тому, как государство говорит с гражданами. И, наконец, сблизился с тем, что понимается на школьных уроках литературы под «образом автора». Как устроен этот образ и что может сделать пишущий, чтобы тональность текста попала в цель?
...Английский термин Tone of Voice (сокращенно ToV) обозначает...
...Образ автора, неуловимый и вездесущий ToV описывает...
За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».
...За двадцать лет Национальный корпус русского языка...
...Первые корпусы появились в 1960-х годах, но тогда...
Номер посвящен русскому языку в мире и выходит в год, объявленный СНГ Годом русского языка как языка межнационального общения. В него вошли статьи о теоретических проблемах социолингвистики, о положении русского языка в России и в мире, о языках народов России и т. д. Выпуск доступен на сайте журнала.
...Номер посвящен русскому языку в мире и выходит в год...
...Номер открывается статьей главного редактора журнала...
Предлагаем вниманию читателей портала статью Михаила Петерсона, опубликованную в журнале «Русский язык в школе» (№ 5, 1952). В статье дана классификация союзов и описаны их основные функции. Статья и спустя 60 лет после ее написания будет очень полезна преподавателям русского языка как родного и как иностранного.
...Предлагаем вниманию читателей портала статью Михаила...
...Предисловие «Грамоты.ру» Михаил Николаевич...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Что за напасть? Почему столько иностранных слов почти в каждом предложении, печатном или произнесенном в радио- и телеэфире? Зачем нам имидж, если есть образ, к чему саммит, если можно сказать «встреча в верхах»? Чем модный нынче в кинематографии римейк лучше обычной переделки? И разве консенсус прочнее согласия?
...Что за напасть? Почему столько иностранных слов почти...
...Читаю газеты: Участники саммита пришли к консенсусу...
Работу над Концепцией государственной языковой политики с 2022 года вело Министерство просвещения РФ по поручению президента. В пятницу, 14 июня, пресс-служба ведомства сообщила об утверждении документа правительством, после чего он был опубликован. Концепция закрепляет особый статус русского языка как государственного, подчеркивая важность сохранения языкового многообразия. В ней даны определения таких понятий, как государственный язык РФ, государственные ...
...Работу над Концепцией государственной языковой политики...