Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В ноябре пользователи интересовались, среди прочего, тем, как произносится слово «кафе», как правильно писать названия разных видов сумок и как расставить знаки препинания в сложном предложении, которое стало предметом спора.
...В ноябре пользователи интересовались, среди прочего...
...Произношение Вопрос: Почему в слове кафе ф произносится...
Как хорошо вы замечаете ошибки? Давайте проверим, сможете ли вы работать корректором. Мы взяли предложения из корпуса «Русская классика» Национального корпуса русского языка и добавили в них ошибки. Будьте внимательны: мы хотели усложнить вам задачу, поэтому в разных предложениях вы встретите разные ошибки. Иногда это орфографическая ошибка, иногда — пунктуационная, иногда — грамматическая. В каждом из десяти вопросов только одно предложение не содержит ошибок. Сможете ли вы его найти?
...Как хорошо вы замечаете ошибки? Давайте проверим, сможете...
В последнее время устаревшая церковнославянская и конфессиональная лексика активно используются современными массмедиа. Рассчитанные на массового читателя и слушателя, современные массово-коммуникативные тексты, воспроизводя стандартные языковые модели, обращаются к устаревшей лексике для большей эмоциональности, экспрессивности.
...В последнее время устаревшая церковнославянская и конфессиональная...
...Исследователь проблем современного русского языка Е...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
Представление об односоставном предложении до некоторой степени есть у любого человека, который окончил среднюю школу и кое-что помнит из курса русского языка. Но при этом в современной лингвистике задача полного описания односоставных предложений пока не решена.
...Представление об односоставном предложении до некоторой...
...Односоставное предложение — и это признано...
Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.
...Уже сейчас писатели издают книги, которые написаны...
...Кто лучше напишет рассказ? В ходе эксперимента писателю...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Что за напасть? Почему столько иностранных слов почти в каждом предложении, печатном или произнесенном в радио- и телеэфире? Зачем нам имидж, если есть образ, к чему саммит, если можно сказать «встреча в верхах»? Чем модный нынче в кинематографии римейк лучше обычной переделки? И разве консенсус прочнее согласия?
...Что за напасть? Почему столько иностранных слов почти...
...Читаю газеты: Участники саммита пришли к консенсусу...
Коммуникативный запрет — это не «стоп-лист», а добровольный отказ от той или иной модели речевого поведения. Таково видение обсуждаемой проблемы Владимира Ильича Карасика, доктора филологических наук, профессора кафедры общего и русского языкознания Института Пушкина. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...Коммуникативный запрет — это не «стоп-лист...
...Один из известнейших дискурсологов Владимир Карасик...