Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Эрзянский и мокшанский языки были добавлены в «Яндекс Переводчик» в начале июля, сообщили в пресс-службе Министерства культуры, нацполитики и архивного дела Мордовии. По данным 2023 года, на мокшанском языке говорят в общей сложности 228 025 человек, а на эрзянском — 96 860 человек. В ведомстве уточнили, что работу над этим обновлением «Яндекс» вел в партнерстве с
...Эрзянский и мокшанский языки были добавлены в&...
Кто бы ни брался за создание «расширительного» словаря того или иного типа, все непременно приходили к Далю — к этому великому человеку-словарю. Подавляющее большинство людей связывает имя Даля со знаменитым четырехтомником. Все остальное, что сделал, написал, пережил Владимир Иванович, заслонено его «Словарем».
...Кто бы ни брался за создание «расширительного...
...Весть из Вермонта В конце 1989 года в «Литературной...
На сайте Русского географического общества опубликовано интервью с кандидатом филологических наук, старшим научным сотрудником Института языкознания РАН и специалистом по лингвистической картографии Юрием Коряковым.
...На сайте Русского географического общества опубликовано...
...Идея создания «Карты языков России» возникла...
О начале работы над корпусом объявили участники круглого стола, прошедшего в Тувинском институте гуманитарных и прикладных социально-экономических исследований (ТИГПИ) 22 июня. Круглый стол был посвящен 95-летию тувинской письменности и проводился в рамках Международного десятилетия языков коренных народов под эгидой ЮНЕСКО. Новый корпус будет насчитывать более 20 млн словоупотреблений, в том числе из газетного корпуса (около 10 млн), параллельного ...
...О начале работы над корпусом объявили участники...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
28 мая в России в четвертый раз отмечали Международный день ясного языка. Этот день, в числе прочего, — возможность рассказать об особых потребностях некоторых групп людей в области чтения и понимания информации. Именно для этого существует адаптированный вариант языка, называемый ясным. В 2024 году Дом культуры «ГЭС-2» при поддержке благотворительных фондов «Даунсайд Ап» («Синдром любви») и «Лучшие ...
...28 мая в России в четвертый раз отмечали...
«Словарь языка М. В. Ломоносова» реализуется силами авторского коллектива Института лингвистических исследований Российской академии наук (ИЛИ РАН). Издание уникально: оно впервые масштабно показывает вклад просветителя в формирование научного языка и русской культуры XVIII века. Авторы называют свой труд «многоаспектным словарем-справочником, объектом описания которого является идиолект М. В. Ломоносова». Первый том открывают краткий очерк ...
...«Словарь языка М. В. Ломоносова» реализуется...
За последние 30 лет эмодзи (смайлы) стали универсальным феноменом. К 2015 году, согласно исследованиям, 92% людей использовали их в онлайн-общении. Одна из причин популярности эмодзи в том, что они могут быть понятны каждому — по крайней мере базовые символы, обозначающие радость, грусть или гнев. Но даже их люди могут интепретировать по-разному, как выяснили авторы статьи в журнале PLOS ONE. К исследованию привлекли 253 добровольцев из ...
...За последние 30 лет эмодзи (смайлы) стали универсальным...
С 21 по 27 октября 2024 года в Самарканде и Ташкенте прошла завершающая Неделя русского языка, организованная центром «Златоуст» при поддержке СПбГУ, фонда «Русский мир», департамента внешнеэкономических и международных связей правительства Москвы (ДВМС) и Московского дома соотечественника (МДС). Публикуем рассказ о событиях недели от наших коллег.
...С 21 по 27 октября 2024 года в ...
...Предыдущие недели русского языка в Узбекистане...