Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Занятия по подготовке к тесту на сертификат «Русский как иностранный» 1-го и 2-го уровня в нашей школе проходят третий год. Тест состоит из пяти разделов: «Лексика и грамматика», «Чтение», «Аудирование», «Письмо» и «Говорение». Русскоязычные дети без особых усилий справляются с заданиями раздела «Лексика и грамматика». Выполнение заданий разделов «Чтение» и «Аудирование» требует разъяснения и тренировки (навыка медленного чтения, концентрации внимания на деталях). Лексика и синтаксические конструкции текстов не вызывают особых затруднений.
...Занятия по подготовке к тесту на сертификат «...
...Подготовка к сертификату предполагает, прежде...
«О составлении „Этимологического словаря русского языка“ как о главной цели своей научной деятельности я мечтал еще во время первых исследований, посвященных влиянию греческого языка на славянские (1906-1909), — писал Макс Фасмер о своем труде. — Многие пожелания, высказанные в рецензиях на мой словарь, несомненно, будут полезными для последующего русского этимологического словаря, в котором должно быть уделено особое внимание многочисленным словам, названным здесь неясными. Если бы мне пришлось начать работу снова, я уделил бы большее внимания калькам и семасиологической стороне».
...«О составлении „Этимологического словаря...
...Известный ученый-славист В. Кипарский, пытаясь...
Большинство пользователей ищут слово на Грамоте, если они не уверены в его правописании, произношении или значении. Но иногда человек хочет найти слово или выражение, которое он просто недослышал или неправильно вычленил из потока речи. Мы проанализировали поисковые запросы уходящего года и выбрали 15 странных слов, которые нас удивили, порадовали или озадачили. Попробуем догадаться, как они пришли в голову спрашивающим и что на самом деле имелось в виду.
...Большинство пользователей ищут слово на Грамоте, если...
...Подобные вымышленные слова крайне интересны с точки...
Предлагаем вниманию читателей статью Сергея Петровича Обнорского, опубликованную в журнале «Русский язык в школе» (№ 5–6, 1939). Статья представляет собой текст доклада, прочитанного на заседании Правительственной комиссии по разработке единой орфографии и пунктуации 7 октября 1939 года. В этой работе рассматриваются спорные орфографические вопросы, стоявшие перед лингвистами в 1930-е годы, при подготовке общеобязательного свода правил русского правописания.
...Предлагаем вниманию читателей статью Сергея Петровича...
...Предисловие «Грамоты.ру» Сергей Петрович...
На XI Международной конференции Тотального диктанта «Динамические процессы в современном русском языке» выступил с лекцией академик РАН, автор научно-просветительского бестселлера «Почему языки такие разные» Владимир Александрович Плунгян. Лекция была посвящена сохранению языкового многообразия на территории Российской Федерации.
...На XI Международной конференции Тотального диктанта...
...Всего в России 152 языка (по системе подсчета Ю. Б....
Специалисты компании «Яндекс» научили нейросеть создавать выжимку из текстов на русском языке и представлять его основные идеи в виде тезисов. Статью объемом до 30 тысяч знаков можно сократить до небольшого конспекта в 300–1000 знаков. Протестировать функцию может любой желающий, зайдя через «Яндекс.Браузер» на сайт 300.ya.ru. Нужно просто загрузить ссылку на нужный материал, и нейросеть переработает его. Тезисы появятся в том же окне. Ссылку на краткое содержание ...
...Специалисты компании «Яндекс» научили нейросеть...
Работа над расширением возможностей Грамоты продолжается. В последнее время были внесены некоторые изменения, которые делают общение с Грамотой более комфортным. 1. На главной странице Грамоты появился блок «Учебник». Теперь можно прямо отсюда увидеть все правила, которые уже есть в Учебнике Грамоты, и перейти на интересующее пользователя интерактивное упражнение. 2. Для тех, кто использует интерактивные упражнения в бумажном виде, есть ...
...Работа над расширением возможностей Грамоты продолжается...
Лингвисты из Института языкознания РАН выявили в материалах переписи населения 2021 года несколько языков, на которых больше не говорят. Анализируя ответы респондентов на вопрос, какими языками они владеют, специалисты обнаружили пять языков, которые отнесены к исчезнувшим (алеутский, керекский, айнский, сиреникский и югский), а также один, отнесенный к заснувшим (орочский). Общее между двумя категориями в том, что этими языками никто полноценно не владеет.
...Лингвисты из Института языкознания РАН выявили в ...
Каждый год специалисты фиксируют, что происходит с языком: какие слова становятся популярными, как меняется норма, каким образом влияют на язык новые законодательные инициативы. Всю правду о том, как жилось русскому языку в уходящем году, раскроет научный руководитель Грамоты, а также председатель филологического совета Тотального диктанта, научный сотрудник Института русского языка им. В. В. Виноградова РАН и ведущий подкаста «Розенталь и Гильденстерн» Владимир Пахомов. Лекция ...
...Каждый год специалисты фиксируют, что происходит с...