Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Казалось бы, дореволюционная русская орфография перестала существовать больше ста лет назад. Между тем наши современники продолжают по разным причинам ее использовать — кто-то в силу симпатий к дореволюционной России и ее культуре, кто-то из эстетических соображений. Энтузиасты ведут блоги, переиздают и пишут книги в старой орфографии. О том, какие мотивы стоят за этим выбором, Грамоте рассказал филолог Алексей Любжин.
...Казалось бы, дореволюционная русская орфография перестала...
...Замысел: «Орфография и стилистика растут из одного...
В русском языке, как известно, есть два способа образования сравнительной степени: с помощью суффиксов («холоднее», «веселей») и путем прибавления к форме положительной степени слова «более» («более холодный», «более веселый»). В отношении синтетической простой формы сравнительной степени типа «веселее» у языковедов споров не возникает: она признаётся морфологической (если, конечно, вообще категория степеней сравнения причисляется к морфологическим категориям). По поводу же образований типа «более холодный» в специальной литературе существуют две противоположные точки зрения.
...В русском языке, как известно, есть два способа...
... Виктор Владимирович Виноградов, например, писал...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Создатель и руководитель Саратовской лингвистической школы Ольга Борисовна Сиротинина в этом году отметила столетний юбилей. 75 лет она изучает русский разговорный язык. «Жизнь вопреки, или Я счастливый человек» — так называется книга мемуаров, которую ученики составили на основе ее устных рассказов.
...Создатель и руководитель Саратовской лингвистической...
...Ольга Борисовна Сиротинина родилась в Саратове в 1923...