модель предложения | Журнал

Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.

...Нейросети учатся на текстах, созданных человеком. Но...

...Грамота: Одна из страшилок, связанных с развитием...

Проблема клатча и тоута: каким сумкам нужен дефис

В ноябре пользователи интересовались, среди прочего, тем, как произносится слово «кафе», как правильно писать названия разных видов сумок и как расставить знаки препинания в сложном предложении, которое стало предметом спора.

...В ноябре пользователи интересовались, среди прочего...

...Произношение Вопрос: Почему в слове кафе ф произносится...

Тест: в каком предложении нет ни одной ошибки?

Как хорошо вы замечаете ошибки? Давайте проверим, сможете ли вы работать корректором. Мы взяли предложения из корпуса «Русская классика» Национального корпуса русского языка и добавили в них ошибки. Будьте внимательны: мы хотели усложнить вам задачу, поэтому в разных предложениях вы встретите разные ошибки. Иногда это орфографическая ошибка, иногда — пунктуационная, иногда — грамматическая. В каждом из десяти вопросов только одно предложение не содержит ошибок. Сможете ли вы его найти?

...Как хорошо вы замечаете ошибки? Давайте проверим, сможете...

Церковная лексика в практике современных СМИ

В последнее время устаревшая церковнославянская и конфессиональная лексика активно используются современными массмедиа. Рассчитанные на массового читателя и слушателя, современные массово-коммуникативные тексты, воспроизводя стандартные языковые модели, обращаются к устаревшей лексике для большей эмоциональности, экспрессивности.

...В последнее время устаревшая церковнославянская и конфессиональная...

...Исследователь проблем современного русского языка Е...

Нейросети проиграли людям при поиске грамматических ошибок

Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...

...Большие языковые модели (чат-боты на основе искусственного...

Исследователи предложили новую биокультурную модель возникновения языка

Долгое время среди научных журналистов и даже среди лингвистов была популярна идея «серебряной пули». Считалось, что уникальная языковая способность человека возникла благодаря одному конкретному событию — например, случайной генетической мутации. Эта теория объясняла язык как внезапно возникший инстинкт, но оставляла за скобками вопрос: почему другие животные, обладающие развитым мозгом, так и не заговорили. Новая работа, опубликованная в

...Долгое время среди научных журналистов и даже...

Михаил Дымарский: «В учении об односоставном предложении есть уязвимые места»

Представление об односоставном предложении до некоторой степени есть у любого человека, который окончил среднюю школу и кое-что помнит из курса русского языка. Но при этом в современной лингвистике задача полного описания односоставных предложений пока не решена.

...Представление об односоставном предложении до некоторой...

...Односоставное предложение — и это признано...

Сможет ли искусственный интеллект заменить писателей?

Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.

...Уже сейчас писатели издают книги, которые написаны...

...Кто лучше напишет рассказ? В ходе эксперимента писателю...

Нейросети научились обману и манипуляциям вопреки запретам

Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...

...Генеративные нейросети обучаются на огромных объемах...

Промпт: запрос к языковой модели

Промпт ворвался в русский язык вместе с ChatGPT и Midjourney в 2022 году. Но его история началась в Древнем Риме и прошла через театральные подмостки и командную строку DOS, прежде чем соединиться с историей нейросетей.

...Промпт ворвался в русский язык вместе с ChatGPT и Midjourney...

...Что это значит Слово промпт пришло из английского...

Почитать на грамоте