Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Мы каждый день пользуемся речью, чтобы общаться устно или письменно, и для нас это естественно. Но речь — это еще и мощный инструмент, который позволяет нам формулировать и доносить свои мысли, рассуждать, спорить, убеждать и вдохновлять людей. От умения владеть словом может зависеть, примут ли нашу идею на совещании, подпишутся ли на наш канал, будут ли покупать наш продукт. Какие качества отличают хорошую речь и как можно развивать эти качества?
...Мы каждый день пользуемся речью, чтобы общаться устно...
...Что такое хорошая речь К тому, как мы пользуемся...
Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.
...Кажется, что машины начали вести с нами диалог...
...Работа по сценарию Разработчики будущих чат-ботов...
Прежде всего приношу свои извинения за то, что вынесла в заголовок слово, которое тонкому слуху просвещенного читателя может показаться оскорбительным. На самом деле никакого отношения к некоему естественному физиологическому процессу эта лексическая единица не имеет, а вот к теме «Язык и Рунет» тяготеет самым наинепосредственнейшим образом. Ибо данное слово в лексиконе юного поколения, погрузившегося в дебри Интернета, означает всего лишь персональный компьютер.
...Прежде всего приношу свои извинения за то, что вынесла...
...Общеизвестно, что на английском языке personal computer...
Русский язык не только вещь в себе, но и вещь в нас и вокруг нас. Меня давно уже интересует проблема взаимодействия русского языка с языками наук, языками искусств и разными видами человеческой деятельности.
...Русский язык не только вещь в себе, но и ...
...Недавно мы с Георгием Борисовичем Шабатом1 закончили...
Выпуск посвящен семантике русских слов и отражает результаты работы Лаборатории машинного перевода МГПИИЯ в первой половине 1960-х годов. В нем опубликованы работы Александра Жолковского, Нины Леонтьевой, Виктора Розенцвейга, Юрия Щеглова и других исследователей. Сборник на момент написания был ценным вкладом в исследование семантики русского языка и предложил основу для разработки семантических алгоритмов и формальных методов описания значений слов.
...Выпуск посвящен семантике русских слов и отражает результаты...
...Владение смыслом слов проявляется у говорящего в способности...
Ситуация не такая уж редкая: девушка из России выходит замуж за иностранца, уезжает в другую страну, и там молодая семья ждет ребенка. Больше других волнуется будущая бабушка Т. М.: «Ребенку придется учиться говорить сразу на двух языках. Не повредит ли это его развитию?» На письмо обеспокоенной бабушки ответила психолингвист Ирина Михайловна Румянцева. С разрешения автора письма и Т. М. публикуем его почти полностью.
...Ситуация не такая уж редкая: девушка из России выходит...
...Уважаемая Т. М., ... тронута тем, что внучка...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Изучение систем коммуникации животных по понятным причинам долгое время ограничивалось наблюдениями. Затем появилась аппаратура, записывающая аудио- и видеоинформацию, возникла идея экспериментального подхода, и, наконец, на помощь специалистам пришли цифровые технологии и искусственный интеллект. Грамота рассказывает, как специалисты сегодня применяют эти методы и что узнаю́т с их помощью.
...Изучение систем коммуникации животных по понятным причинам...
...Наблюдение, слежка и прослушка Чтобы что-то понять...