Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Грамота началась как ресурс для журналистов, а теперь без обращения к ней не обходятся ни редакторы, ни корректоры. Поэтому мы решили, что будем время от времени рассказывать нашим читателям не только о правилах правописания, языковой политике и научных открытиях, но и о тех, для кого любовь к языку определила выбор рода занятий, а владение им стало частью профессии. Наша первая героиня — редактор художественной литературы Татьяна Гармаш.
...Грамота началась как ресурс для журналистов, а теперь...
...1. Образование и опыт работы Я окончила филологический...
В новом выпуске — разговорная речь в качестве ресурса для коммерческих номинаций городских объектов, мем «суету навести охота», знаменитая «глокая куздра» лингвиста Льва Щербы и другие темы. Рассмотрим подробнее три статьи номера.
...В новом выпуске — разговорная речь в ...
...Разговорная речь как ресурс для коммерческих номинаций...
Когда-то мы смеялись над корявостью и глупостью первых языковых моделей. Сегодня чат-боты пишут за людей деловые письма и посты, сочиняют рассказы, ведут задушевные беседы и приводят аргументы в спорах. Есть ли что-то, чем речь машины в корне отличается от человеческой? И может ли эксперт — или даже другая машина — обнаружить эту разницу?
...Когда-то мы смеялись над корявостью и глупостью первых...
...Гладко, но безжизненно Машина пишет текст не ...
Арик Кершенбаум — зоолог из Кембриджского университета, специалист по коммуникации животных. Он изучает волков, гиббонов и дельфинов, чтобы «не только лучше понимать, как они живут и как их сохранить, но и больше узнать об эволюции нашего собственного языка». В его первой книге «Путеводитель зоолога по Галактике» речь шла о возможной жизни на других планетах. В начале 2024 года вышла в свет новая книга — «Почему животные разговаривают». Грамота перевела его интервью, опубликованное в британском издании The Guardian.
...Арик Кершенбаум — зоолог из Кембриджского...
...Почему вы решили написать эту книгу? Моя предыдущая...
Формы организации текстового материала в Интернете весьма разнообразны. Не претендуя на формирование понятий, связанных с Интернетом, попробуем разобраться в семантике тех слов, которые, используя Интернет, мы уже часто употребляем, хотя они еще не получили своего места в лексической системе русского языка.
...Формы организации текстового материала в Интернете...
...Условно виртуальные тексты по способу образования и...
Когда мы называем слова «фантастическими», мы имеем в виду не просто опечатки. Речь идет о случайно порождаемых словах, которые образованы по моделям уже существующих в русском языке единиц. Какие интересные примеры невольного словотворчества наших пользователей подарил ушедший 2025 год? Мы выбрали 12 любопытных экземпляров, которые встретились в поисковых запросах Грамоты.
...Когда мы называем слова «фантастическими...
...Умяукали Приставка у часто придает глаголу значение...
2023 год стал вызовом для наук о языке во всем мире. Оказалось, что большие языковые модели (самый известный их представитель — ChatGPT) гораздо лучше справляются с порождением осмысленных высказываний и текстов, чем модели, которые предлагались до этого внутри лингвистики. В результате мнения специалистов о новых технологических достижениях разделились: одни их игнорируют или оспаривают их результаты, другие пытаются концептуально осмыслить и даже ...
...2023 год стал вызовом для наук о языке во...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...