Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Мы с несколькими коллегами работаем над новым двуязычным русско-немецким и немецко-многоязычным (в том числе русским) онлайн-словарем синтаксических фразеологизмов. В течение следующего года мы планируем достичь объема триста словарных статей по каждому из двух языков и опубликовать первую версию словаря, но будем продолжать над ним работать и его пополнять.
...Мы с несколькими коллегами работаем над новым двуязычным...
...Синтаксические фразеологизмы-конструкции представляют...
Онлайн-журнал «Системный Блокъ» рассказал о масштабных нововведениях в НКРЯ: появились новые корпуса и новые функции.
...Онлайн-журнал «Системный Блокъ» рассказал...
...Национальный корпус русского языка (НКРЯ) — ключевой...
На презентации издания, которая состоялась 5 апреля на книжной ярмарке NonFiction, выступили историк, доктор исторических наук, профессор кафедры истории России до XIX века исторического факультета МГУ им. М. В. Ломоносова Антон Горский и лингвист, доктор филологических наук, ведущий научный сотрудник отдела языков народов Азии и Африки Института востоковедения РАН Светлана Бурлак.
...На презентации издания, которая состоялась 5 апреля...
...Антон Горский рассказал об истории сомнений в ...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Устный перевод с турецкого сложен тем, что глагол стоит в конце фразы, поэтому синхронный перевод превращается, по сути, в очень быстрый последовательный. А что самое увлекательное в работе с письменными текстами? Мы спросили у тюрколога, переводчика, доктора филологических наук Аполлинарии Аврутиной, с какими самыми большими вызовами она сталкивалась при переводе художественной литературы. И услышали две яркие и поучительные истории.
...Устный перевод с турецкого сложен тем, что глагол...
...Работа, которой я горжусь до сих пор, —...
О русском языке можно не только читать, но и слушать. Мы собрали очень разные подкасты и радиопрограммы: архивные и самые новые, часовые и минутные, с приглашенными экспертами и авторские. Из них можно узнать много нового и неожиданного про русский язык: его историю и современное состояние, значение слов и фразеологических оборотов, про неологизмы и жаргонизмы, про речевой этикет и историю алфавита.
...О русском языке можно не только читать, но и слушать...
...Рекомендуем выбрать подходящую длительность, ведущих...
Представление об односоставном предложении до некоторой степени есть у любого человека, который окончил среднюю школу и кое-что помнит из курса русского языка. Но при этом в современной лингвистике задача полного описания односоставных предложений пока не решена.
...Представление об односоставном предложении до некоторой...
...Односоставное предложение — и это признано...
Грамота решила не ограничиваться в 2024 году толкованием слова вайб и проделала аналогичную работу с теми словами, которые особенно часто появлялись в запросах наших пользователей. Это имена существительные маркетплейс, стендап, буллинг, худи, чекап, инфлюенсер, абьюз, абьюзер, вишлист, гойда, кипиш, кринж, а также имена собственные «Ютуб» и «Ватсап», которые получили широкое распространение и фактически употребляются как нарицательные. На примере пяти новых слов мы покажем, что у нас получилось.
...Грамота решила не ограничиваться в 2024 году толкованием...
...В лаборатории лексикографа В рамках проекта «...
Новые слова, попадая в язык, быстро привлекают наше внимание. А вот новые значения старых слов не так бросаются в глаза, хотя они могут быть очень показательны. В шорт-лист прошлого «Слова года» вошли аскеза, прилет и осознанность в новых значениях. Лингвист Ирина Левонтина показывает, что у прилагательного продуманный тоже появилось новое значение, причем с яркой эмоциональной окраской.
...Новые слова, попадая в язык, быстро привлекают наше...
...Разумеется, само по себе слово продуманный совершенно...