Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов разбираются, на какой слог падает ударение в фамилии известного русского поэта Константина Бальмонта.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов обсуждают произношение слова «договор» и его производных, причем на этом примере рассказывается о том, что наряду с литературной нормой существует вполне допустимая устная норма.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов рассказывают о правильном ударении в слове «завсегдатай» и в других русских словах, заканчивающихся на -атай (например, глашатай).
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов рассказывают о правильной постановке ударения в слове «фетиш» и его формах, а также касаются истории этого слова, которое пришло в русский язык из французского, где ударение всегда падает на последний слог
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
8 сентября — Международный день грамотности. Уровень грамотности в России — один из самых высоких в мире. По последним данным Института статистики ЮНЕСКО, он составляет 99,93%. Кроме того, Россия находится на втором месте в мире по числу публичных библиотек: их 46 тысяч. Ее обходит только Китай, где их больше 51 тысячи. Но всеобщее умение читать и писать — цель, которая была достигнута в нашей стране еще в
...8 сентября — Международный день грамотности...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
В пятницу, 20 сентября, в Библиотеке иностранной литературы начнется Фестиваль языков мира. Он будет проходить в течение трех дней и позволит посетителям познакомиться с работой лингвистов, узнать о нюансах изучения языков: английского, немецкого, итальянского, арабского, португальского, китайского, французского и даже межславянского. Фестиваль может быть интересен семьям с детьми, студентам, преподавателям, переводчикам, специалистам по ...
...В пятницу, 20 сентября, в Библиотеке иностранной...
Группа «Словаря русского языка XIX в.» Института лингвистических исследований Российской академии наук (ИЛИ РАН) приглашает принять участие в VI Международной научной конференции «Русский язык XIX века: взгляд из века XXI». В рамках конференции предполагается затронуть проблемы, связанные с историей русского языка: активные процессы в лексике XIX века: словообразование, семантика, стилистика; проблемы ...
...Группа «Словаря русского языка XIX в.»...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...В 2024 году Национальному корпусу русского языка...