Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Иногда создается впечатление, что корректоры больше никому не нужны. С одной стороны, есть спелл-чекеры, которые неплохо справляются с основными проблемами. С другой, привычка читать мессенджеры и соцсети размывает уважение к правилам: побеждает подход «понятно, и ладно», указывать на чужие ошибки неприлично… Но представить себе качественный текст без корректуры по-прежнему невозможно. О незаметной работе, в которой есть свои вызовы и удовольствия, рассказывает корректор Грамоты Марк Кантуров.
...Иногда создается впечатление, что корректоры больше...
...1. Образование и опыт работы Я окончил Новосибирский...
Исследователи Балтийского центра нейротехнологий и искусственного интеллекта БФУ им. Канта натренировали большую языковую модель на текстах трудов Иммануила Канта. В результате, по их словам, модель научилась поддерживать диалог о философских понятиях. Пресс-служба БФУ опубликовала несколько цитат из ответов бота. Например, вот как он отреагировал на вопрос, возможна ли ложь во спасение: «Дорогой друг, я считаю, что ложь не может быть использована во спасении. Ведь ложь противоречит ...
...Исследователи Балтийского центра нейротехнологий и...
Наталья Мавлевич — переводчик с французского, преподаватель, ученица Лилианны Лунгиной — рассказала «Арзамасу» о детстве, учебе в университете, первых работах и первых переводах. Мы выбрали несколько цитат из этого разговора.
...Наталья Мавлевич — переводчик с французского,...
...1. Французская кафедра филологического факультета МГУ...
Пока политики ищут национальную идею, которая смогла бы консолидировать общество, такая идея, как представляется, уже овладела умами россиян: самоидентификация идет в поле русского языка. Трехлетний опыт общения с аудиторией программ «Как правильно?» и «Говорим по-русски!» (а вопросы от слушателей поступают к нам из более чем 70 городов России от носителей языка самых разных возрастов и социального положения, что позволяет считать нашу многомиллионную аудиторию неким представительным срезом общества) показывает: реформа орфографии заставляет испытывать тревогу и вызывает не меньший, если не больший интерес, чем проводимые экономические и социальные реформы.
...Пока политики ищут национальную идею, которая смогла...
...Своеобразным пропуском в элиту общества кажется не...
Английский термин Tone of Voice (сокращенно ToV) обозначает ту интонацию, которую улавливает в тексте читатель. Этот термин пришел из маркетинга и сначала касался только бизнес-коммуникаций, голоса бренда. Затем он стал применяться к любым видам коммуникаций с аудиторией, в том числе и к тому, как государство говорит с гражданами. И, наконец, сблизился с тем, что понимается на школьных уроках литературы под «образом автора». Как устроен этот образ и что может сделать пишущий, чтобы тональность текста попала в цель?
...Английский термин Tone of Voice (сокращенно ToV) обозначает...
...Образ автора, неуловимый и вездесущий ToV описывает...
Человечество постоянно изобретает способы превратить агрессию в созидательную энергию. Будь то поэтическая дуэль скальдов, современный рэп-батл или прием буддийского мастера, — оскорбление, лишенное своего буквального значения и помещенное в контекст ритуала, становится особым способом социального взаимодействия и даже формой искусства.
...Человечество постоянно изобретает способы превратить...
...Дазенс: словесный бокс — Твоя мама такая...
Мы с несколькими коллегами работаем над новым двуязычным русско-немецким и немецко-многоязычным (в том числе русским) онлайн-словарем синтаксических фразеологизмов. В течение следующего года мы планируем достичь объема триста словарных статей по каждому из двух языков и опубликовать первую версию словаря, но будем продолжать над ним работать и его пополнять.
...Мы с несколькими коллегами работаем над новым двуязычным...
...Синтаксические фразеологизмы-конструкции представляют...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...
Думаю, русский язык за последние 25 лет сильно изменился, что и должно происходить с любым живым языком. Возможно, этот процесс шел даже быстрее, чем в другие периоды, потому что наша жизнь меняется очень стремительно. И скорости увеличиваются, и целые новые области жизни появляются, а с ними и пласты слов.
...Думаю, русский язык за последние 25 лет сильно изменился...
...В первую очередь можно вспомнить всё, что связано с...