В середине апреля открытая интернет-энциклопедия «Рувики» объявила о добавлении разделов на бурятском, вепсском, ингушском, калмыцком, коми, коми-пермяцком, ливвиковском (часть лингвистов относит его к диалекту карельского языка) и хакасском языках. Согласно пресс-релизу, таким образом проект поддерживает работу по сохранению языков народов России. Ранее в «Рувики» были добавлены одиннадцать разделов на языках народов, живущих в
...В середине апреля открытая интернет-энциклопедия...
В новом выпуске — разговорная речь в качестве ресурса для коммерческих номинаций городских объектов, мем «суету навести охота», знаменитая «глокая куздра» лингвиста Льва Щербы и другие темы. Рассмотрим подробнее три статьи номера.
...В новом выпуске — разговорная речь в ...
...Разговорная речь как ресурс для коммерческих номинаций...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
На XI Международной конференции Тотального диктанта «Динамические процессы в современном русском языке» выступил с лекцией академик РАН, автор научно-просветительского бестселлера «Почему языки такие разные» Владимир Александрович Плунгян. Лекция была посвящена сохранению языкового многообразия на территории Российской Федерации.
...На XI Международной конференции Тотального диктанта...
...Всего в России 152 языка (по системе подсчета Ю. Б....
В последнее время все чаще высказывается мнение о том, что слово «Интернет» надо писать со строчной (маленькой) буквы. Основной аргумент сторонников такого написания: Интернет стал единой, всемирной, общераспространенной информационной сетью, таким же общепринятым средством передачи информации, как, например, телефон.
...В последнее время все чаще высказывается мнение о том...
...Пишем же мы это слово со строчной буквы! Но справедлива...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Статьи номера посвящены вводному слову «кстати», проблемам перевода с английского, формам личных имен в первом и третьем лице, концепту «документ» в речи крестьян и другим темам. Обратим внимание на три статьи.
...Статьи номера посвящены вводному слову «кстати...
...Способы сохранения гендерной неопределенности персонажей...
В журнале «Наука и жизнь» (№ 5 и № 9, 2010 год) опубликованы две лингвистические задачи, составленные кандидатом филологических наук Ильей Иткиным. В них используются факты латышского и белорусского языков. Предлагаем вам их решить.
...В журнале «Наука и жизнь» (№ 5 и №...
...Латышская задача Даны предложения и словосочетания...