Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Сборник работ Виктора Петровича Григорьева «Будетлянин» посвящен творчеству русского поэта Велимира (Виктора Владимировича) Хлебникова. Грамота публикует одну из статей, вошедших в этот сборник.
...Сборник работ Виктора Петровича Григорьева «...
...Веха — один из псевдонимов Хлебникова....
Латинский язык нельзя назвать мертвым в той же мере, что древнеегипетский, хеттский или даже древнегреческий. Традиция преподавания латинского языка непрерывна и восходит к средневековым университетам; его до сих пор изучают историки, юристы, богословы, медики. Но уйти в прошлое ему не дают главным образом филологи-классики и многочисленные энтузиасты, которые до сих пор используют его для живого общения.
...Латинский язык нельзя назвать мертвым в той же...
...Где он живет Чтобы язык считался хоть сколько-нибудь...
Нижеследующее изложение представляет собой обзор исторических и личностных обстоятельств, при которых равноапостолы Кирилл и Мефодий изобрели для славян первую упорядоченную азбуку (глаголицу, вскоре замененную кириллицей), а также графических и фонетико-лингвистических принципов ее создания.
...Нижеследующее изложение представляет собой обзор исторических...
...Исторические и личностные обстоятельства изобретения...
Слово зумер набрало 42% голосов специалистов. В группу лидеров также вошли выгорание (38%), ред-флаг (37%) и промпт (36%). В голосовании приняли участие 469 филологов из 23 организаций по всей России — из Москвы, Санкт-Петербурга, Владивостока, Владикавказа, Волгограда, Екатеринбурга, Перми, Ростова-на-Дону, Нижнего Новгорода, Майкопа, Петропавловска-Камчатского, Челябинска, Омска, Иркутска, Ставрополя, Красноярска, Калуги, Петрозаводска, Воронежа ...
...Слово зумер набрало 42% голосов специалистов....
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Языки отличаются друг от друга фонетикой, грамматикой, синтаксисом, способами организации лексических значений. Мы привыкли считать нормой то, как говорим мы сами, поэтому чем больше в чужом языке отличий от нашего, тем больше удивления он у нас вызывает. Попробуем посмотреть на русский язык глазами иностранца: что он отмечает в первую очередь, с какими проблемами сталкивается, когда начинает учить наш язык?
...Языки отличаются друг от друга фонетикой, грамматикой...
...Фонетические мучения Носителей итальянского, испанского...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...
На портале для киноманов IndieWire вышла статья «Сконструированные языки не всегда добираются до финальной версии фильмов, но „Дюна: часть вторая“ показывает, почему они должны там быть». Дэвид Питерсон, известный как создатель дотракийского и валирийского языков для сериала «Игра престолов», и его жена и коллега Джесси рассказали изданию о своей работе над чакобса, языком фрименов. Грамота публикует перевод этой статьи.
...На портале для киноманов IndieWire вышла статья «...
...Известного рода фанатам когда-то приходилось гоняться...
Мы все знаем о политике, а вот о языковой политике мало кто знает. Языковая политика — это государственная политика, идеология и соответствующие ей действия, направленные на решение языковых проблем, на достижение определенного языкового состояния в обществе. Традиционно выделяют ретроспективное и перспективное направления в языковой политике. Перспективная языковая политика предполагает так называемое языковое строительство (например, создание алфавитов для бесписьменных языков). Ретроспективное направление — это языковая культура (или культура речи) в самом широком понимании, то есть поддержание норм литературного языка и целенаправленное внедрение их в общество (то есть в носителей языка), культивирование норм среди носителей языка.
...Мы все знаем о политике, а вот о языковой политике...
...Кстати, как вы произносите — в Се́ти или в Сети́...