Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В новом номере мы выделили три статьи: о редукции безударных гласных до нуля и отражении этого явления в словарях, о возможностях и перспективах Национального словарного фонда и об экспериментальном исследовании вариативности при согласовании сказуемого с квантифицированным подлежащим.
...В новом номере мы выделили три статьи: о ...
...Редукция до нуля — норма? В некоторых...
Наша чувствительность к языкам — удивительная черта, которая позволяет нам быстро овладевать речью. Считается, что раннее освоение языка состоит из двух этапов. В ходе первого младенцы учатся отличать звуки родительского языка от посторонних звуков, другими словами, развивают чувствительность к звучанию именно того языка, на котором будут говорить. Этот процесс принято называть перцептивной настройкой (от perception — восприятие, схватывание). На втором этапе ребенок ...
...Наша чувствительность к языкам — удивительная...
Анна Константиновна Поливанова рассказала проекту Arzamas о своем детстве, об отношениях с учителями, взглядах на язык и принципах рациональной науки. Этот большой разговор будет интересен не только лингвистам.
...Анна Константиновна Поливанова рассказала проекту...
...Учителями Анны Поливановой были Андрей Зализняк, Юрий...
Восьмое марта — противоречивый праздник: начался он с борьбы за равноправие женщин, а продолжается под пожелания «быть мужу воздухом весенним, быть летним солнцем для детей». Рассказать о том, как обстоят дела с неравноправием в языке, и выбрать подходящие поздравления с Женским днем, Грамоте помог Валерий Ефремов — доктор филологических наук, заведующий кафедрой русского языка филологического факультета РГПУ им. А. И. Герцена, соведущий программы «Как это по-русски» на «Радио России Петербург».
...Восьмое марта — противоречивый праздник:...
...Поэтка и блогерка против мастера маникюра Главные...
Предлагаем вниманию читателей портала статью Рубена Александровича Будагова, опубликованную в журнале «Русский язык в школе» (№ 2, 1968). В ней описаны разные версии происхождения слов-омонимов «мандарин», их судьба в разных языках, а также французское выражение «убить мандарина» и его связь с этическим выбором, описанным в романе Достоевского «Преступление и наказание».
...Предлагаем вниманию читателей портала статью Рубена...
...Предисловие «Грамоты.ру» Рубен Александрович...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
В творчестве Пушкина много загадок, а отгадку часто надо искать за пределами самого текста — прежде всего в античной литературе и мифологии. Издание, подготовленное в издательстве «Грамота», — больше, чем просто словарь. Его можно назвать путеводителем по миру пушкинских поэтических символов и эстетических намеков.
...В творчестве Пушкина много загадок, а отгадку...
...В допушкинскую эпоху считалось непоэтичным использовать...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Английский термин Tone of Voice (сокращенно ToV) обозначает ту интонацию, которую улавливает в тексте читатель. Этот термин пришел из маркетинга и сначала касался только бизнес-коммуникаций, голоса бренда. Затем он стал применяться к любым видам коммуникаций с аудиторией, в том числе и к тому, как государство говорит с гражданами. И, наконец, сблизился с тем, что понимается на школьных уроках литературы под «образом автора». Как устроен этот образ и что может сделать пишущий, чтобы тональность текста попала в цель?
...Английский термин Tone of Voice (сокращенно ToV) обозначает...
...Образ автора, неуловимый и вездесущий ToV описывает...