Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
В 1780-х годах императрица Екатерина II поручила ученому-энциклопедисту, путешественнику, академику Берлинской и Санкт-Петербургской академий наук Петру Симону Палласу (1741–1811) составить сравнительный словарь языков народов России и всего мира. Первое издание (в двух частях, которые вышли в 1787 и 1789 годах) включало 273 понятия, которые были представлены (с лакунами) на 149 языках Азии и 51 языке Европы.
...В 1780-х годах императрица Екатерина ...
Изменения в законе о государственном языке были закреплены в виде отдельного федерального закона в феврале 2023 года. В новой версии закон о госязыке ограничивает употребление слов и выражений, не соответствующих нормам современного русского литературного языка, кроме иностранных слов без общеупотребительных аналогов в русском языке, которые будут зафиксированы в нормативных словарях. Однако, как отмечают авторы нового законопроекта, не все сферы оказались охвачены. «Рекламные ...
...Изменения в законе о государственном языке были закреплены...
Какие английские слова и словосочетания стали лидерами по итогам голосования, рассказывает сайт «Годлитературы.рф».
...Какие английские слова и словосочетания стали лидерами...
...Слово года в этот раз впервые определили пользователи...
В нашем обществе существует множество мифологических представлений о русском языке и его истории. Это связано с особенностями современного медиапространства: с одной стороны, информация о языке нередко искажается в СМИ; с другой стороны, широкие возможности для построения ошибочных теорий и их распространения предоставляет интернет. Нелингвисты, как правило, не всегда понимают, в чем разница между языком и правописанием, что такое норма языка и кто ее фиксирует, почему происходят изменения в ...
...В нашем обществе существует множество мифологических...
Портал «Грамота.ру» следит за успехами проекта «Тотальный диктант». Ежегодная образовательная акция привлекает все больше участников. В 2014 году диктант писали 64 тысячи человек в 352 городах мира. Ключевые составляющие успешного проекта — оригинальный текст (в этом году автором текста был Алексей Иванов), грамотный менеджмент и лингвистическое обеспечение на академическом уровне. Мы поговорили с председателем экспертной комиссии Тотального диктанта Натальей Борисовной Кошкарёвой — не только о диктанте.
...Портал «Грамота.ру» следит за успехами...
...Лингвисты в полях Грамота: Наталья Борисовна, пользуясь...
В июне правительство РФ приняло Концепцию государственной языковой политики. Его разработка была инициирована президентом РФ в 2019 году. Концепция подтверждает особую роль русского языка как государственного и настрой государства на сохранение языкового разнообразия. Грамота напоминает основные вехи российской и советской языковой политики и приводит мнения экспертов о новом документе.
...В июне правительство РФ приняло Концепцию государственной...
...Русификация и коренизация «На протяжении...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
На XI Международной конференции Тотального диктанта «Динамические процессы в современном русском языке» выступил с лекцией академик РАН, автор научно-просветительского бестселлера «Почему языки такие разные» Владимир Александрович Плунгян. Лекция была посвящена сохранению языкового многообразия на территории Российской Федерации.
...На XI Международной конференции Тотального диктанта...
...Всего в России 152 языка (по системе подсчета Ю. Б....