Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Создатель и руководитель Саратовской лингвистической школы Ольга Борисовна Сиротинина в этом году отметила столетний юбилей. 75 лет она изучает русский разговорный язык. «Жизнь вопреки, или Я счастливый человек» — так называется книга мемуаров, которую ученики составили на основе ее устных рассказов.
...Создатель и руководитель Саратовской лингвистической...
...Ольга Борисовна Сиротинина родилась в Саратове в 1923...