Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Поскольку я не просто русист, а русист-диалектолог и фонетист, то меня, как и все сообщество русистов-диалектологов, которые понимают важность диалектов для истории языка и для понимания современного состояния языка, очень волнует их исчезновение.
...Поскольку я не просто русист, а русист-диалектолог...
...Игорь Исаев: «Мы прикладываем недостаточно усилий для...
...Еще до революции, в 1910-е годы, Алексей Александрович...
В мире насчитываются тысячи языков, на которых говорят миллиарды людей. И тем не менее энтузиасты продолжают изобретать все новые искусственные языки разной степени проработанности — от пары фраз до полноценного словаря и грамматики. На какие группы делятся сконструированные языки — конланги — и для кого они предназначены?
...В мире насчитываются тысячи языков, на которых...
...Чем нас привлекают искусственные языки...
...Какие бывают конланги Одни конланги основаны на уже...
Отчего безропотное принятие смерти от рук убийц, подосланных нечестивцем, который захватил киевский престол, стало причиной канонизации братьев и прославило их в веках? Что такое «удвоенная» святость и греховная «двойственность»? И почему настоящим прародителем Святополка, рожденного, согласно автору жития, от двух отцов, на самом деле был третий отец — дьявол? «Горький» продолжает публикацию статей Андрея Ранчина из цикла «Как читать древнерусскую литературу».
...Отчего безропотное принятие смерти от рук убийц, подосланных...
...Как читать «Сказание о Борисе и Глебе»...
...Князья-братья Борис и Глеб — одни из самых почитаемых...
Прежде всего приношу свои извинения за то, что вынесла в заголовок слово, которое тонкому слуху просвещенного читателя может показаться оскорбительным. На самом деле никакого отношения к некоему естественному физиологическому процессу эта лексическая единица не имеет, а вот к теме «Язык и Рунет» тяготеет самым наинепосредственнейшим образом. Ибо данное слово в лексиконе юного поколения, погрузившегося в дебри Интернета, означает всего лишь персональный компьютер.
...Прежде всего приношу свои извинения за то, что вынесла...
...От писюка слышу...
...Общеизвестно, что на английском языке personal computer...
В новом выпуске — разговорная речь в качестве ресурса для коммерческих номинаций городских объектов, мем «суету навести охота», знаменитая «глокая куздра» лингвиста Льва Щербы и другие темы. Рассмотрим подробнее три статьи номера.
...В новом выпуске — разговорная речь в ...
...Вышел в свет шестой выпуск журнала «Русская речь» за...
...Разговорная речь как ресурс для коммерческих номинаций...
«Грамота.ру» продолжает публикацию материалов из архива журнала «Русский язык в школе». Предлагаем вашему вниманию ответы редакции журнала на вопросы учителей русского языка. Эти ответы были опубликованы почти 80 лет назад, в № 4 за 1937 год, но будут интересны и современному читателю. В тексте сохранены особенности орфографии и пунктуации тех лет.
...«Грамота.ру» продолжает публикацию материалов...
...Ответы редакции журнала «Русский язык в школе» на вопросы...
...К какому роду относятся имена существительные, употребляемые...
В подлинности «Слова» чаще сомневаются историки и литературоведы, а не лингвисты. О том, какие лингвистические аргументы позволяют говорить о подлинности «Слова», филолог Елена Галинская пишет в статье для журнала «Наука и жизнь».
...В подлинности «Слова» чаще сомневаются...
...«Слово о полку Игореве»: точка в споре?...
...Уже два столетия не утихают споры об одном из главных...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Кому и зачем нужен Национальный корпус русского языка...
...Грамота: С какими целями создавался корпус? А. К.:...
Наверняка вы обращали внимание на то, как часто герои англоязычных сериалов вместо простых «нет» или «да» произносят не всем знакомые выражения типа no way или you bet. Что это такое и почему об этом почти не говорили на уроках в школе? На сайте «Системный Блокъ» рассказывают о дискурсивных формулах и новом цифровом ресурсе для их изучения в русском языке, а также поиска аналогов в английском.
...Наверняка вы обращали внимание на то, как часто герои...
...Зачем нужен «Прагматикон»...
...Дискурсивные формулы — это короткие устойчивые...