Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...
В книге «История библиотек: от глиняных табличек до медиапространств» детский писатель Мария Коноплястая рассказывает об эволюции книжных собраний с древности до наших дней и показывает, почему библиотеки до сих пор остаются «аптеками для души» и «храмами литературы».
...В книге «История библиотек: от глиняных табличек...
...С появлением письменности люди начали использовать...
Учитель русского языка Ольга Маевская напоминает в журнале «Наука и жизнь», как правильно склонять числительные в косвенных падежах. В первой статье речь идет о сложных количественных числительных (десятках и сотнях), во второй — о числительных «ноль», «оба» и собирательных числительных.
...Учитель русского языка Ольга Маевская напоминает в...
...Ошибки в склонении числительных нередко делают и журналисты...
Откуда в русских словах беглые гласные и как это явление связано с падением редуцированных в древнерусском языке? Объясняет преподаватель Алексей Лебедев в журнале «Наука и жизнь».
...Откуда в русских словах беглые гласные и ...
...Слова сон и слон очень похожи: они оба мужского...
Исследование, проведенное на платформе онлайн-рекрутинга hh.ru, показало, что среди слов и фраз, которые вызывают наибольшее раздражение, лидируют уменьшительно-ласкательные формы, такие как человечек и задачка. На втором месте по частоте упоминания — слово засинкаться, а также родственные ему синк и синкануться (от англ. synchronization ‘синхронизация’ в значении ‘встреча, позволяющая синхронизировать работу команды’). Эти слова упомянули 21% ...
...Исследование, проведенное на платформе онлайн-рекрутинга...
Справочной службе Грамоты часто в разных формах задают такой вопрос: «Последнее время дикторы стали склонять названия: в Останкине, в Конькове и т. д. У нас что, изменились правила русского языка или для дикторов сделали послабление, чтобы они себе не забивали голову?» Этот миф получил широкое распространение: будто бы варианты «в Болдине», «из Останкина», «в Пулкове» — «новояз», безграмотность, порча языка.
...Справочной службе Грамоты часто в разных формах...
...Встречаются даже такие эмоциональные высказывания:&...
За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».
...За двадцать лет Национальный корпус русского языка...
...Первые корпусы появились в 1960-х годах, но тогда...
Сразу несколько представителей профильных ведомств в последние дни призвали ужесточить требования к тому уровню, на котором мигранты владеют русским языком. В частности, об этом заявил на пресс-конференции 24 июня заместитель руководителя Федерального агентства по делам национальностей Станислав Бедкин. А спустя три дня на эту тему высказался руководитель Федеральной службы по надзору в сфере образования и науки (Рособрнадзора) Анзор Музаев в ходе ...
...Сразу несколько представителей профильных ведомств...
В современном русском языке принято выделять шесть падежей, но в интернете периодически возникают дискуссии по поводу их количества — особо смелые авторы увеличивают число вдвое. Лингвист Алексей Лебедев в статье для журнала «Наука и жизнь» показывает, что почти все якобы исчезнувшие падежи можно считать либо частными случаями основных шести, либо особыми формами слов.
...В современном русском языке принято выделять шесть...
...В древнерусском языке действительно было больше...