Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Каждый день мы сталкиваемся с огромным количеством больших и маленьких текстов, но не всегда нам удается сразу осознать прочитанное. Что такое читательская грамотность и почему ее важно развивать? Грамота публикует статью нашего партнера, Всероссийского чемпионата сочинений «Своими словами», которая помогает увидеть сбои в логике, фантазии, преувеличения и неправомерные обобщения там, где при обычном чтении мы не замечаем ничего подозрительного.
...Каждый день мы сталкиваемся с огромным количеством...
...Почему мы можем неверно понять текст Чтобы разобраться...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...