Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Каждый день мы сталкиваемся с огромным количеством больших и маленьких текстов, но не всегда нам удается сразу осознать прочитанное. Что такое читательская грамотность и почему ее важно развивать? Грамота публикует статью нашего партнера, Всероссийского чемпионата сочинений «Своими словами», которая помогает увидеть сбои в логике, фантазии, преувеличения и неправомерные обобщения там, где при обычном чтении мы не замечаем ничего подозрительного.
...Каждый день мы сталкиваемся с огромным количеством...
...Почему мы можем неверно понять текст Чтобы разобраться...
Отчего безропотное принятие смерти от рук убийц, подосланных нечестивцем, который захватил киевский престол, стало причиной канонизации братьев и прославило их в веках? Что такое «удвоенная» святость и греховная «двойственность»? И почему настоящим прародителем Святополка, рожденного, согласно автору жития, от двух отцов, на самом деле был третий отец — дьявол? «Горький» продолжает публикацию статей Андрея Ранчина из цикла «Как читать древнерусскую литературу».
...Отчего безропотное принятие смерти от рук убийц, подосланных...
...Князья-братья Борис и Глеб — одни из самых почитаемых...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
И пользователи Грамоты, и те, кто предпочитает бумажные издания, часто замечают, что один словарь рекомендует одно ударение, другой — другое, а третий вообще приводит оба варианта как равноправные. Если один словарь разрешает «кофе» в среднем роде, а другой возражает против такой вольности, кому верить? Ответ неочевиден, поскольку универсального словаря на все случаи жизни не существует. Более того, не все словари ставят перед собой задачу зафиксировать строгую норму. Как же тогда выбрать правильный вариант, какие критерии использовать, на что обращать внимание? Попробуем разобраться.
...И пользователи Грамоты, и те, кто предпочитает бумажные...
...Словари прескриптивные и дескриптивные Литературная...
Предлагаем вниманию читателей статью Рубена Ивановича Аванесова, опубликованную в журнале «Русский язык в школе» (№ 4, 1948). В ней даны основные сведения об ударении и его типах. Автор объясняет, что такое фразовое, логическое, тактовое, экспираторное ударение, чем русское ударение отличается от ударения в других языках и как связано ударение с долготой и краткостью гласных.
...Предлагаем вниманию читателей статью Рубена Ивановича...
...Предисловие «Грамоты.ру» Рубен Иванович...
Когда ребенок русскоязычных родителей рождается вне России и оказывается в ситуации двуязычия, где лингвистическое внимание малыша распределяется между двумя и более языками, русский язык оказывается скорее «домашним» языком, нежели общеупотребительным. В этом случае русский язык может сохраниться как родной лишь при том условии, что он наполнится необходимым дополнительным личностным содержанием.
...Когда ребенок русскоязычных родителей рождается вне...
...Для свободного владения языком мало просто понимать...
Первая основана на результатах диалектологической экспедиции во Владимирскую область, а вторая иллюстрирует на разных примерах такое языковое явление, как синтаксическая редупликация.
...Первая основана на результатах диалектологической экспедиции...
...Муромское ёканье Примеры, которые собрали лингвисты...
Соглашаясь с необходимостью законодательного регулирования вопросов, связанных с государственным языком, лингвисты обращают внимание на необходимость уточнения положений закона о государственном языке РФ. Некоторые из них называют отправленный на доработку закон антинаучным, дилетантским и антижурналистским, другие принципиально выступают против законодательного регулирования словоупотребления.
...Соглашаясь с необходимостью законодательного регулирования...
...Текст закона требует уточнений Юрий Караулов ...
Новые слова, попадая в язык, быстро привлекают наше внимание. А вот новые значения старых слов не так бросаются в глаза, хотя они могут быть очень показательны. В шорт-лист прошлого «Слова года» вошли аскеза, прилет и осознанность в новых значениях. Лингвист Ирина Левонтина показывает, что у прилагательного продуманный тоже появилось новое значение, причем с яркой эмоциональной окраской.
...Новые слова, попадая в язык, быстро привлекают наше...
...Разумеется, само по себе слово продуманный совершенно...