Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Михаил Копотев о роли сгенерированных нейросетью текстов...
...Нейросети учатся на текстах, созданных человеком. Но...
...Один и тот же человек будет писать и говорить с разным качеством: например, он будет довольно плохо владеть устной формой и в то же время прекрасно упаковывать информацию в письменный текст с помощью языковых моделей....
...Обучение и самообучение: как синтетические данные влияют...
Сериал «Слово пацана», который активно обсуждают уже почти два месяца, заинтересовал нас не только словом «чушпан», которое даже называли в качестве кандидата на роль слова года. Насколько точно на экране передан сленг улицы в целом? Грамота поговорила об этом Шамилем Идиатуллиным, который в 1980-е годы жил в городе Брежнев (ныне Набережные Челны) и написал об этом времени книгу.
...Языковые реалии 1980-х по воспоминаниям жителя Татарстана...
...Сериал «Слово пацана», который активно...
...В то же время не было и такого, что «я приехал, сейчас тут порядок наведу». Этим местная жизнь отличалась от казанской. Мой дом 45-14 Кроме того, была специфика, связанная с комплексами....
...В «Редакции Елены Шубиной» опубликованы его романы «Бывшая Ленина» (2019), «Последнее время» (2020), «Возвращение „Пионера“» (2022) и «До февраля» (2023)....
...Классовая ненависть «Слово пацана» не сгущает краски, просто в сериале показана Казань, а не Брежнев, и более позднее время. От школы к школе, от района к району все сильно разнилось. Даже в соседних школах могло быть по-разному....
...Писатель Шамиль Идиатуллин: «Я был нормальный пацан...
Хорошую речь во всех функциональных стилях, безусловно, могут продуцировать носители элитарной речевой культуры, поскольку они обладают истинным мастерством владения языком, всем его богатством при соблюдении всех правил и ограничений. К сожалению, чаще мы наблюдаем речь не носителей элитарной речевой культуры, а речь носителей среднелитературной речевой культуры, к которой принадлежит большинство лиц с высшим (даже специальным филологическим) образованием.
...Для этого типа речевой культуры, в отличие от элитарной...
...Хорошую речь во всех функциональных стилях, безусловно...
...Именно «олигархи», а не вечно вчерашние зюгановцы, коими одно время пугал Березовский, задавили в стране здоровую конкуренцию, а именно из-за их бандитских махинаций слова «бизнесмен» и «предприниматель» приобрели в общественном восприятии...
...; ...тут все время стаскивает с ce6я штаны, бегает голышом по версальским лужайкам; ...герой, когда не бегает голый, потрясает гусиным пером основы прогнившего режима, uзо все сил приближая тот день, когда оковы тяжкие падут, все снимут штаны, а Бастилию перестроят наконец под Дворец пионеров...
...На основании гетерогенности происхождения среднелитературной языковой культуры можно предположить, что хорошая речь ее носителей — это речь, являющаяся следствием первого пути возникновения этой культуры, в то время как «нехорошая» речь появилась главным образом в результате...
...Хорошая речь и среднелитературная речевая культура...
Если ребенку в младших классах трудно дается чтение, это может быть признаком дислексии. При этом ребенок вполне сможет научиться читать на уровне других детей, если родители рано обратят внимание на его затруднения и обратятся к специалистам. О том, как проявляется дислексия и какого прогресса удается достичь с помощью специальных упражнений, рассказывает лингвист, основатель детской онлайн-школы «Лаборатория чтения „Верные слова“» Анна Иосифовна Левинзон.
...Шансы бегло читать выше у тех, кто рано начал заниматься...
...Если ребенку в младших классах трудно дается чтение...
...В школах в последнее время эти измерения перестали быть обязательными, а жаль. Скорость чтения — это объективный показатель соответствия умений ребенка возрастной норме. Она измеряется в количестве правильных слов в минуту....
...Часто встречаются проблемы с рабочей памятью, когда ребенок не может запомнить единицы информации, которыми нужно оперировать во время выполнения инструкций. Возможны проблемы с вниманием, когда ребенку трудно сконцентрироваться на задании....
...В то же время есть целый ряд тестов, которые могут выявить детей в зоне риска. Если ребенку повезет, то дислексию распознает педагог на занятиях по подготовке к школе. В педагогических институтах учителям младших классов обязательно рассказывают о дислексии....
...Дети с дислексией: чем родители могут им помочь...
Самое базовое понятие лингвистики до сих пор не до конца осмыслено и требует дополнительных исследований. Некоторые ответы дает наблюдение за людьми, страдающими афазией, пишет в журнале «Наука и жизнь» доктор филологических наук Владимир Алпатов.
...В начале было слово, но лингвисты затрудняются дать...
...Самое базовое понятие лингвистики до сих пор не до...
...Советский психолог Александр Романович Лурия изучал афазии у контуженных на поле боя во время Великой Отечественной войны и выделил тип, названный «телеграфным стилем»....
...Ужели слово найдено?...
Мария Леонидовна Каленчук — главный научный сотрудник и заведующая отделом фонетики Института русского языка им. В. В. Виноградова РАН, член Совета по русскому языку при Президенте РФ, член Орфографической комиссии и председатель Орфоэпической комиссии РАН, эксперт Грамоты. Ее монолог на «Арзамасе» начинается с детства, учебы в школе и в институте и заканчивается признанием в любви к фонетике и описанием процесса создания словарей. Мы выбрали пять цитат из этого монолога.
...Монолог о ключевых точках научной биографии и о главных...
...Мария Леонидовна Каленчук — главный научный...
...Представление о том, что норма — это единственно правильный способ реализации языковой единицы, которое бытовало еще полвека назад, в наше время абсолютный миф и утопия....
...Фонетист Мария Каленчук: «Все, что делается искусственно...
Работа над расширением возможностей Грамоты продолжается. В последнее время были внесены некоторые изменения, которые делают общение с Грамотой более комфортным. 1. На главной странице Грамоты появился блок «Учебник». Теперь можно прямо отюда увидеть все правила, которые уже есть в Учебнике Грамоты, и перейти на интересующее пользователя интерактивное упражнение. 2. Для тех, кто использует интерактивные упражнения в бумажном виде, есть кнопка ...
...На главной странице появился блок Учебника, упражнения...
...В последнее время были внесены некоторые изменения, которые делают общение с Грамотой более комфортным. 1. На главной странице Грамоты появился блок «Учебник»....
...Дневник обновлений: рассылка Грамоты и другие новости...
В новом выпуске — разговорная речь в качестве ресурса для коммерческих номинаций городских объектов, мем «суету навести охота», знаменитая «глокая куздра» лингвиста Льва Щербы и другие темы. Рассмотрим подробнее три статьи номера.
...Лингвистический ландшафт российских городов и глокая...
...В новом выпуске — разговорная речь в ...
...Подобное словосочетание и раньше существовало в литературном языке, но было мало востребовано; в последнее время оно постепенно закрепилось в сфере повседневного непринужденного общения....
...Вышел в свет шестой выпуск журнала «Русская речь» за...
Люди давно поняли, что записывать слова от руки — слишком трудоемкий процесс. Чтобы быстро делиться большими объемами информации, нужно было этот процесс упростить и ускорить. И вот примерно полтора века назад решение было найдено. С тех пор человечество стучит по клавишам.
...Стук клавиш становится все тише, а скорость печати...
...Люди давно поняли, что записывать слова от руки &mdash...
... Новые возможности В наше время все клавиатуры более или менее эргономичны и бесшумны. Знаете, какой грохот стоял в машинописных бюро?...
...Поскольку буквы ё на клавиатуре пишущих машинок долгое время просто не было, машинисткам приходилось производить последовательно три действия: печатать букву е, возвращать каретку и печатать кавычки....
...Для защиты клавиатуры от жидкости и крошек стали использовать дополнительный изолирующий слой между клавишей и резиновой прокладкой: давно понятно, что есть и пить во время работы за компьютером люди не перестанут....
... Так что в России использовались иностранные машинки с русской раскладкой, а тех, кто на них печатали, первое время называли ремингтонистами и ремингтонистками. Примечательно, что саму эту раскладку придумали в конце XIX века в США....
...Время пишущих машинок ушло: последняя фабрика, где их производили, закрылась в Индии в 2011 году. Но клавиатуры остались. Они стали частью электронных устройств: телефонов, планшетов, ноутбуков, превратились в сенсорные панели, соединились со стилусами... Но это уже совсем другая история....
...Всемирная история клавиатур: от букв вместо цифр до...
Тема театра в поэзии конца ХХ века возникает в соответствии с провозглашением установки на игру как творческого метода. Так или иначе она звучит в текстах-манифестах поэтов-метареалистов Ивана Жданова («До слова»), Сергея Соловьева («Амфитеатр печатной машинки...») и Алексея Парщикова («Вступление»).
...Ольга Северская ищет параллели с классиками...
...Тема театра в поэзии конца ХХ века возникает...
...Это отсылка к Дионисийским играм, во время которых в возбужденной пляске участники доводили себя до экстатического состояния «богоодержимости», разрывали на части и пожирали воплощение бога, при этом, растерзав своего бога, они затем пестовали его, как вновь родившегося младенца16...
...Поэтический театр 90-х годов ХХ века: игра слова...