Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Большинство пользователей ищут слово на Грамоте, если они не уверены в его правописании, произношении или значении. Но иногда человек хочет найти слово или выражение, которое он просто недослышал или неправильно вычленил из потока речи. Мы проанализировали поисковые запросы уходящего года и выбрали 15 странных слов, которые нас удивили, порадовали или озадачили. Попробуем догадаться, как они пришли в голову спрашивающим и что на самом деле имелось в виду.
...Большинство пользователей ищут слово на Грамоте, если...
...Какие фантастические слова интересовали пользователей...
...Подобные вымышленные слова крайне интересны с точки...
Ясный язык — это специальная упрощенная форма языка, для каждого языка — своя. В ней нет сложных и длинных конструкций, а слова сопровождаются простыми и наглядными картинками-пиктограммами. Чтобы создать «ясноязычную» версию текста, нужно владеть специальными навыками, ведь задача такой версии — помочь людям, которым по разным причинам трудно прочитать и понять то, что написано обычным языком.
...Ясный язык — это специальная упрощенная форма...
...В переводе на ясный: язык как инструмент инклюзии...
...Кому нужен ясный язык По мнению нейропсихолога Елены...
Перемены в языке не в последнюю очередь связаны с переменами в обществе. Подтверждение этому тезису можно найти как в истории, так и в окружающей нас действительности. Газеты, радио, телевидение сыплют «пиарами», «траншами», реклама глушит «чумовыми джок-дайлами», «офшорами» и «таймшерами». Мы все больше привыкаем к вхождению в наш повседневный язык большого количества новых слов иноязычного происхождения, но, привыкая к ним, хорошо бы отдавать себе отчет в правильности и уместности их употребления, а зачастую и в элементарном понимании значения того или иного слова.
...Перемены в языке не в последнюю очередь связаны...
...«Толерантность» или «терпимость»: о борьбе «красиво...
...Уже второй год, отправляя студентов на практику, я...
В течение первого года жизни нейропластичность максимальна: в это время формируется больше всего новых нейронов и связей между ними. Исследователи давно предполагали, что с самого раннего возраста мозг младенцев, родившихся в монолингвальных и билингвальных семьях, работает по-разному в том, что касается обработки речи. Однако ограничения в технологиях не позволяли понять, что происходит непосредственно в мозге, когда ребенок слышит речь. Группа ...
...У детей-билингвов уже в четыре месяца мозг работает...
...В течение первого года жизни нейропластичность...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Владимир Плунгян: «Первый урок корпуса — не злоупотреблять...
...Грамота: Все, кто работает с языком как исследователи...
Сто баллов за единый государственный экзамен (ЕГЭ) по русскому языку получили 2636 выпускников. Такие данные привел руководитель комиссии разработчиков контрольных измерительных материалов ЕГЭ Роман Дощинский на пресс-конференции Рособрнадзора. Это на 12,5% меньше, чем в прошлом году: тогда высший балл получили 3014 человек. Впрочем, в 2022 году стобалльников было еще меньше — 2375 человек. Роман Дощинский обратил внимание на высокий уровень освоения ...
...Сто баллов за ЕГЭ по русскому языку получили меньше...
...Сто баллов за единый государственный экзамен (ЕГЭ)...
Как в точности соотносятся церковнославянский, старославянский и древнерусский языки? На это вопрос даже многие выпускники филологических факультетов не могут дать внятный ответ. При этом если древнерусский и старославянский остались в далеком прошлом, церковнославянский жив и сегодня, хотя и для ограниченного круга людей. Как сложилась его судьба и чем он интересен с лингвистической точки зрения? Об этом Грамота поговорила с ведущим научным сотрудником Института русского языка им. В. В. Виноградова РАН, руководителем научного центра по изучению церковнославянского языка и проекта создания Большого словаря церковнославянского языка Нового времени Александром Геннадьевичем Кравецким.
...Как в точности соотносятся церковнославянский, старославянский...
...Лингвист Александр Кравецкий: «У церковнославянского...
...Грамота: В чем все-таки разница между древнерусским...
Правительство РФ внесло в Госдуму законопроект о создании Национального словарного фонда — единого цифрового ресурса, содержащего данные словарей русского языка. Закон «О государственном языке РФ» предлагается дополнить статьей, которая будет регламентировать создание и работу Национального словарного фонда. Под ним понимается государственная информационная система, в которой будут представлены данные о нормах современного русского ...
...Законопроект о Национальном словарном фонде внесли...
...Правительство РФ внесло в Госдуму законопроект...
В русском языке, как известно, есть два способа образования сравнительной степени: с помощью суффиксов («холоднее», «веселей») и путем прибавления к форме положительной степени слова «более» («более холодный», «более веселый»). В отношении синтетической простой формы сравнительной степени типа «веселее» у языковедов споров не возникает: она признаётся морфологической (если, конечно, вообще категория степеней сравнения причисляется к морфологическим категориям). По поводу же образований типа «более холодный» в специальной литературе существуют две противоположные точки зрения.
...В русском языке, как известно, есть два способа...
...«Более лучше, более веселее»...
... Виктор Владимирович Виноградов, например, писал...