Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Чем отличаются диалект, говор и наречие, можно ли считать носителя говора неграмотным, нужно ли избавляться от говора, какой из русских диалектов ближе к древнерусскому языку — об этом рассказал в большом интервью онлайн-изданию «Т—Ж» член-корреспондент РАН, профессор факультета антропологии Европейского университета Николай Вахтин.
...Чем отличаются диалект, говор и наречие, можно...
...Диалект, говор и наречие привязаны к определенной...
IV Костомаровский форум привлек значительный интерес общественности. Всего на него, по данным организаторов, зарегистрировались (для личного и дистанционного участия) 6734 представителя из 116 стран мира, сайт форума посетили почти 80 тыс. человек. Программа включала 53 мероприятия, в том числе конференции, панельные дискуссии, круглые столы, мастер-классы, презентации образовательных проектов и научных исследований. Представители Грамоты ...
...IV Костомаровский форум привлек значительный интерес...
Изначально этот текст, написанный лет десять назад и называвшийся «Заметки графофила», имел ограниченное хождение среди моих друзей и знакомых. Позднее бóльшая его часть под заголовком «„И пучину взворотила и поставила вверх дном“? (заметки об авторской пунктуации)» была опубликована в газете «Русский язык» (№ 7 за 2002 год). Сокращения коснулись отступления про «авторскую орфографию», а также материалов, найденных в интернете. Авторская орфография заслуживает отдельного обстоятельного разбора, текстов из интернета я и сейчас тоже почти не касаюсь.
...Изначально этот текст, написанный лет десять назад...
...За прошедшие десять лет интернет вырос многократно,...
Профессиональный жаргон — это особая смесь из необычных слов, нестандартных ударений, странных сокращений и смешных идиом. Это словесные шифры, которые обычно понимают только свои. Угадать, кто такой «бобик» или «ходуля», невозможно. Как устроены птичьи языки разных профессий и чем они отличаются от стандартного литературного языка?
...Профессиональный жаргон — это особая смесь...
...Язык как средство социальной идентификации Язык, как...
Зачем филологи отправляются в экспедиции и проводят полевые исследования в разных частях России? Что можно узнать о языке только «на местности»? Ведущая программы «Наблюдатель» Фекла Толстая пригласила обсудить результаты последнего полевого сезона диалектологов и фольклористов.
...Зачем филологи отправляются в экспедиции и ...
...В передаче участвовали: Андрей Мороз —...
О том, чем лингвистам интересны анекдоты, о своей лингвистической находке, об особенностях общения в интернете, а также о том, что отличает культурную речь от некультурной, порталу «Правмир» рассказал доктор филологических наук Алексей Шмелев.
...О том, чем лингвистам интересны анекдоты, о ...
...Анекдот — важная часть городского фольклора...
С чем ассоциируется латинский язык у современных молодых людей? Кто-то вспомнит про католическое богослужение. Юристы имеют дело с латынью, когда изучают римское право. Тот, кто интересуется историей, ответит, что латинский — язык древних римлян. Но есть еще один важный аспект: латинский, став международным языком образованных людей, сильно повлиял на русский язык и культуру.
...С чем ассоциируется латинский язык у современных молодых...
...Язык на особом положении Латинский язык присутствует...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
На портале для киноманов IndieWire вышла статья «Сконструированные языки не всегда добираются до финальной версии фильмов, но „Дюна: часть вторая“ показывает, почему они должны там быть». Дэвид Питерсон, известный как создатель дотракийского и валирийского языков для сериала «Игра престолов», и его жена и коллега Джесси рассказали изданию о своей работе над чакобса, языком фрименов. Грамота публикует перевод этой статьи.
...На портале для киноманов IndieWire вышла статья «...
...Известного рода фанатам когда-то приходилось гоняться...