Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...говорят специалисты, the only thing better than big data...
...is bigger data....
В новом номере журнала «Русская речь» наше внимание привлекли три статьи: о киргизском варианте русского языка, об акцентуации фразеологизмов и о происхождении слова инфохомяк. Также из этого номера можно узнать о частице чай в среднерусском говоре, заимствованиях из китайского и истории выражения хоть (матушку) репку пой.
...В новом номере журнала «Русская речь»...
...Английское слово состоит из двух частей: data...