Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Что такое речевой этикет? Расхожие определения, которые можно нагуглить в интернете, несколько дезориентируют: они сводят речевой этикет к употреблению формул вежливости, типа «спасибо» и «пожалуйста», то есть к знанию определенной, не слишком сложной лексики. Увы, если бы все было так просто! Неочевидные особенности этикетных требований разных культур показывает филолог и переводчик Мария Елифёрова.
...Что такое речевой этикет? Расхожие определения, которые...
...Чем отличаются правила речевого этикета в русских и...
...Говоря о стилях речи, мы чаще всего представляем...
Английский термин Tone of Voice (сокращенно ToV) обозначает ту интонацию, которую улавливает в тексте читатель. Этот термин пришел из маркетинга и сначала касался только бизнес-коммуникаций, голоса бренда. Затем он стал применяться к любым видам коммуникаций с аудиторией, в том числе и к тому, как государство говорит с гражданами. И, наконец, сблизился с тем, что понимается на школьных уроках литературы под «образом автора». Как устроен этот образ и что может сделать пишущий, чтобы тональность текста попала в цель?
...Английский термин Tone of Voice (сокращенно ToV) обозначает...
...Tone of voice: правила обращения с читателями...
...Образ автора, неуловимый и вездесущий ToV описывает...
Лингвистика, как и почти всякая другая наука, существует не только в себе и для себя: она призвана распространять достигнутые ею результаты вовне — в среду неспециалистов, которые заняты иными, далекими от науки делами: варят сталь, водят поезда, пашут землю... Многим из них, однако, небезразличны судьбы родного языка и особенности языковой жизни общества. Информация же об этом в доступных средствах информации весьма случайна и скудна.
...Лингвистика, как и почти всякая другая наука, существует...
...Популяризация лингвистических знаний в средствах массовой...
...Лишь время от времени мы можем прочитать в газете или...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Чат-боты GPT и другие: что думают лингвисты о больших...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Одна из особенностей современных массово-коммуникативных текстов — использование устаревшей лексики: историзмов и архаизмов. Между тем проблема актуализации устаревших единиц языка не исчерпывается одними лексемами. Часто на страницах современных изданий встречаются элементы дореформенной графики, такие как «ять», «и десятеричное» и др. Они встречаются в рекламных текстах, в названиях коммерческих предприятий и общественных организаций, в заголовках статей, в логотипах газет и журналов.
...Одна из особенностей современных массово-коммуникативных...
...Дореформенная орфография и современная реклама...
...Очень популярно сейчас стало, стилизуясь под дореволюционную...
Нейросети уже неплохо справляются с анализом и порождением текстов, они умеют многое из того, что раньше делали только люди. Какие возможности это дает? Участники круглого стола «Ай да AI. Нейросети и создание текстов: проблемы и перспективы генеративных моделей» обсудили, чем ИИ может помочь в научной работе и какие навыки понадобятся людям в цифровую эпоху. Грамота записала самое главное.
...Нейросети уже неплохо справляются с анализом и...
...Что нейросети умеют делать с текстами и чем предстоит...
...В дискуссии на Костомаровском форуме участвовали руководитель...
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Российские исследователи предложили новую модель генерации...
...Ключевые слова в научных статьях, монографиях...
Любимые всеми книги и фильмы часто рассказывают захватывающие и необычные истории. Но и таким форматам, как рекламный ролик или пост в блоге, чтобы попасть в топы просмотров, необходимо чем-то зацепить пользователя. Сегодня авторы нередко обращаются к генеративным языковым моделям в поисках вдохновения. Но есть ли в этом польза? Может быть, правы скептики, и их массовое применение убьет творчество? Исследователи Анил Доши из Лондонского ...
...Языковые модели оказались хорошими помощниками в написании...
...Любимые всеми книги и фильмы часто рассказывают...
Хорошую речь во всех функциональных стилях, безусловно, могут продуцировать носители элитарной речевой культуры, поскольку они обладают истинным мастерством владения языком, всем его богатством при соблюдении всех правил и ограничений. К сожалению, чаще мы наблюдаем речь не носителей элитарной речевой культуры, а речь носителей среднелитературной речевой культуры, к которой принадлежит большинство лиц с высшим (даже специальным филологическим) образованием.
...Хорошую речь во всех функциональных стилях, безусловно...
...Хорошая речь и среднелитературная речевая культура...
...Среднелитературная речевая культура, напомним, отличается...