Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Среди слов, собранных в разных регионах России школьниками — участниками проекта «Слова для своих», встречаются и обозначения местной нечисти. Представления о ней восходят порой к весьма древним верованиям. В святочной колонке Ирины Фуфаевой речь пойдет о словах, которые не имеют однословных аналогов в литературном языке, да и вообще с трудом поддаются точному толкованию.
...Среди слов, собранных в разных регионах России...
...Денотат — это сущность реального мира, которая...
К шестидесятилетию «Орфографического словаря русского языка» предлагаем вашему вниманию публикацию, рассказывающую об истории одного написания, которое кажется нам сейчас привычным и единственно возможным, а 80 лет назад считалось ошибочным. Это написание «плавучий».
...К шестидесятилетию «Орфографического словаря...
...Предисловие «Грамоты.ру» 25...
«Грамота.ру» продолжает публикацию материалов из архива журнала «Русский язык в школе». Предлагаем вашему вниманию ответы редакции журнала на вопросы учителей русского языка. Эти ответы были опубликованы почти 80 лет назад, в № 4 за 1937 год, но будут интересны и современному читателю. В тексте сохранены особенности орфографии и пунктуации тех лет.
...«Грамота.ру» продолжает публикацию материалов...
...К какому роду относятся имена существительные, употребляемые...
Сборник работ Виктора Петровича Григорьева «Будетлянин» посвящен творчеству русского поэта Велимира (Виктора Владимировича) Хлебникова. Грамота публикует одну из статей, вошедших в этот сборник.
...Сборник работ Виктора Петровича Григорьева «...
...Веха — один из псевдонимов Хлебникова....
Проблема различения языка и диалекта не перестает быть актуальной для взаимоотношений разных народов и стран. От лингвистов требуют предъявить строгие научные критерии разграничения этих понятий, но в действительности едва ли не большую роль играют экстралингвистические факторы.
...Проблема различения языка и диалекта не перестает быть...
...Задача с двумя неизвестными Представим, что есть два...
Гендерная проблематика явилась для лингвистики последних десятилетий подлинным открытием, хотя для ряда языков (например, японского, корейского, чукотского и др.) разделение языка на мужской и женский варианты было обыденным явлением, незаметным, как воздух, которым дышит человек (конечно, до поры до времени незаметным).
...Гендерная проблематика явилась для лингвистики последних...
...Европейские языковеды наперегонки бросились открывать...
В древнерусском и церковнославянском языках не было буквы «ё». Среди кириллических алфавитов эта буква используется нечасто, прежде всего в русском, однако в нем она остается необязательной. К истории буквы «ё» дважды обращается журнал «Наука и жизнь».
...В древнерусском и церковнославянском языках не было...
...Почему букве ё отказывают в праве на существование?...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Всё чаще можно слышать, что большие языковые модели вроде ChatGPT «пишут как люди». На первый взгляд их способность имитировать нашу речь действительно потрясает. Но более пристальный научный анализ все же выявляет различия. Научная группа из Университета Карнеги — Меллона (США) проверила с помощью методов корпусного анализа, насколько созданные человеком тексты отличаются от текстов в тех же жанрах и стилях, но созданных языковыми моделями (LLM).
...Всё чаще можно слышать, что большие языковые модели...