Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Сразу несколько представителей профильных ведомств в последние дни призвали ужесточить требования к тому уровню, на котором мигранты владеют русским языком. В частности, об этом заявил на пресс-конференции 24 июня заместитель руководителя Федерального агентства по делам национальностей Станислав Бедкин. А спустя три дня на эту тему высказался руководитель Федеральной службы по надзору в сфере образования и науки (Рособрнадзора) Анзор Музаев в ходе ...
...Сразу несколько представителей профильных ведомств...
Европейский союз и Совет Европы объявили первый год нового тысячелетия Европейским годом языков — 2001. Каждый язык занимает важное место в культурном наследии Европы и в ее будущем. Трудно себе представить культурные события, произведения литературы, искусства, научные и другие открытия без упоминания каких-либо имен, принадлежащих языковому многообразию Европы.
...Европейский союз и Совет Европы объявили первый год...
...Наряду с изучением иностранных языков в Европейский...
Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.
...Уже сейчас писатели издают книги, которые написаны...
...Кто лучше напишет рассказ? В ходе эксперимента писателю...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
«Грамота.ру» продолжает публикацию материалов из архива журнала «Русский язык в школе». Предлагаем вашему вниманию ответы редакции журнала на вопросы учителей русского языка. Эти ответы были опубликованы почти 80 лет назад, в № 4 за 1937 год, но будут интересны и современному читателю. В тексте сохранены особенности орфографии и пунктуации тех лет.
...«Грамота.ру» продолжает публикацию материалов...
...К какому роду относятся имена существительные, употребляемые...
Научный консультант Грамоты Владимир Пахомов и журналист Александр Садиков обсудили в девятом сезоне феминитивы, написание «Беларусь», будущее словарей в цифровую эпоху, сохранение языков народов России, а также возможные изменения в русской орфографии и пунктуации.
...Научный консультант Грамоты Владимир Пахомов и ...
...1. Есть ли будущее у русского языка? На русском...
На XI Международной конференции Тотального диктанта «Динамические процессы в современном русском языке» выступил с лекцией академик РАН, автор научно-просветительского бестселлера «Почему языки такие разные» Владимир Александрович Плунгян. Лекция была посвящена сохранению языкового многообразия на территории Российской Федерации.
...На XI Международной конференции Тотального диктанта...
...Всего в России 152 языка (по системе подсчета Ю. Б....
Предки русских, англичан, французов, иранцев, армян, таджиков, греков, части народов Индии и других народов много тысяч лет назад говорили на одном языке, который ученые называют праиндоевропейским. Так что русский язык — не только славянский, о чем всем известно; он также входит в большую и пеструю семью потомков праиндоевропейского языка. В чем проявляется это родство?
...Предки русских, англичан, французов, иранцев, армян...
...Индоевропейские языки и другие языковые семьи...