Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.
...Кажется, что машины начали вести с нами диалог...
...Создать себе подобных: как люди придумали чат-ботов...
...Работа по сценарию Разработчики будущих чат-ботов...
Русский язык не только вещь в себе, но и вещь в нас и вокруг нас. Меня давно уже интересует проблема взаимодействия русского языка с языками наук, языками искусств и разными видами человеческой деятельности.
...Русский язык не только вещь в себе, но и ...
...Григорий Крейдлин: «Увидеть, как связаны единицы мира...
...Недавно мы с Георгием Борисовичем Шабатом1 закончили...
Прежде всего приношу свои извинения за то, что вынесла в заголовок слово, которое тонкому слуху просвещенного читателя может показаться оскорбительным. На самом деле никакого отношения к некоему естественному физиологическому процессу эта лексическая единица не имеет, а вот к теме «Язык и Рунет» тяготеет самым наинепосредственнейшим образом. Ибо данное слово в лексиконе юного поколения, погрузившегося в дебри Интернета, означает всего лишь персональный компьютер.
...Прежде всего приношу свои извинения за то, что вынесла...
...От писюка слышу...
...Общеизвестно, что на английском языке personal computer...
Выпуск посвящен семантике русских слов и отражает результаты работы Лаборатории машинного перевода МГПИИЯ в первой половине 1960-х годов. В нем опубликованы работы Александра Жолковского, Нины Леонтьевой, Виктора Розенцвейга, Юрия Щеглова и других исследователей. Сборник на момент написания был ценным вкладом в исследование семантики русского языка и предложил основу для разработки семантических алгоритмов и формальных методов описания значений слов.
...Выпуск посвящен семантике русских слов и отражает результаты...
...«Машинный перевод и прикладная лингвистика» (1964,...
...Владение смыслом слов проявляется у говорящего в способности...
Ситуация не такая уж редкая: девушка из России выходит замуж за иностранца, уезжает в другую страну, и там молодая семья ждет ребенка. Больше других волнуется будущая бабушка Т. М.: «Ребенку придется учиться говорить сразу на двух языках. Не повредит ли это его развитию?» На письмо обеспокоенной бабушки ответила психолингвист Ирина Михайловна Румянцева. С разрешения автора письма и Т. М. публикуем его почти полностью.
...Ситуация не такая уж редкая: девушка из России выходит...
...«Убеждена, что Вашей внучке несказанно повезло...»...
...Уважаемая Т. М., ... тронута тем, что внучка...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Новый подход поможет людям более успешно общаться с...
...Большие языковые модели — подобные тем,...
Изучение систем коммуникации животных по понятным причинам долгое время ограничивалось наблюдениями. Затем появилась аппаратура, записывающая аудио- и видеоинформацию, возникла идея экспериментального подхода, и, наконец, на помощь специалистам пришли цифровые технологии и искусственный интеллект. Грамота рассказывает, как специалисты сегодня применяют эти методы и что узнаю́т с их помощью.
...Изучение систем коммуникации животных по понятным причинам...
...Какими методами можно изучать язык животных...
...Наблюдение, слежка и прослушка Чтобы что-то понять...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Нейросеть выучилась понимать язык без использования...
...Большие языковые модели — нейросети, способные...
Когда ребенок русскоязычных родителей рождается вне России и оказывается в ситуации двуязычия, где лингвистическое внимание малыша распределяется между двумя и более языками, русский язык оказывается скорее «домашним» языком, нежели общеупотребительным. В этом случае русский язык может сохраниться как родной лишь при том условии, что он наполнится необходимым дополнительным личностным содержанием.
...Когда ребенок русскоязычных родителей рождается вне...
...Как поэтическая речь влияет на формирование родного...
...Для свободного владения языком мало просто понимать...