Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...
Новый номер доступен на сайте журнала «Русская речь». Напомним, что на сайте выложены в открытый доступ все номера журнала за 1967–2022 годы.
...Новый номер доступен на сайте журнала «Русская...
...В новом номере: о недавнем заимствовании из японского...
Отчего безропотное принятие смерти от рук убийц, подосланных нечестивцем, который захватил киевский престол, стало причиной канонизации братьев и прославило их в веках? Что такое «удвоенная» святость и греховная «двойственность»? И почему настоящим прародителем Святополка, рожденного, согласно автору жития, от двух отцов, на самом деле был третий отец — дьявол? «Горький» продолжает публикацию статей Андрея Ранчина из цикла «Как читать древнерусскую литературу».
...Отчего безропотное принятие смерти от рук убийц, подосланных...
...Князья-братья Борис и Глеб — одни из самых почитаемых...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Каждый, кто пишет в газете или популярном журнале о науке, знает, какие мучения вызывает «ввод» научного термина. Часто это слово не знакомо широкому читателю, непонятно даже из контекста и, как правило, воспринимается как «некрасивое» для русского уха и глаза. Сейчас привычные языковые стили меняются, приобретая новые черты. Что представляет собой новый язык науки? Каким становится главное научное слово — термин?
...Каждый, кто пишет в газете или популярном журнале о...
...Сложившийся к началу XX века научный язык — тот...
В конференции участвовали лингвисты, лексикографы, руководители электронных библиотек. Вела конференцию член редакционного совета «Грамоты.ру» Юлия Сафонова.
...В конференции участвовали лингвисты, лексикографы,...
...Докладчики: К. В. Вигурский, к. т. н., генеральный...
Кто бы ни брался за создание «расширительного» словаря того или иного типа, все непременно приходили к Далю — к этому великому человеку-словарю. Подавляющее большинство людей связывает имя Даля со знаменитым четырехтомником. Все остальное, что сделал, написал, пережил Владимир Иванович, заслонено его «Словарем».
...Кто бы ни брался за создание «расширительного...
...Весть из Вермонта В конце 1989 года в «Литературной...
Давно уже замечено, что порой слово, заимствованное из того или иного языка, со временем меняет свое произношение и написание. Процесс этот вполне закономерен и обусловлен освоением заимствования, подчинением его нормам русского языка, в том числе нормам орфоэпическим и орфографическим.
...Давно уже замечено, что порой слово, заимствованное...
...Так, например, слово офис, заимствованное русским языком...
Коммуникативный запрет — это не «стоп-лист», а добровольный отказ от той или иной модели речевого поведения. Таково видение обсуждаемой проблемы Владимира Ильича Карасика, доктора филологических наук, профессора кафедры общего и русского языкознания Института Пушкина. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...Коммуникативный запрет — это не «стоп-лист...
...Один из известнейших дискурсологов Владимир Карасик...