Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
В 2023 году были внесены изменения в Федеральный закон «О государственном языке Российской Федерации». Новая редакция предписывает использовать заимствованные слова только в случае отсутствия русских аналогов. О том, как создавался новый нормативный словарь иностранных слов, а также о том, как меняется русский язык, газете «Санкт-Петербургские ведомости» рассказала доктор филологических наук, заместитель директора по научной работе Института лингвистических исследований РАН Марина Приемышева.
...В 2023 году были внесены изменения в Федеральный...
...Цель создания нормативного словаря иностранных слов...
4 апреля в пресс-центре ТАСС состоялась пресс-конференция, посвященная созданию государственной информационной системы «Национальный словарный фонд». Это электронная информационная система с открытым доступом, имеющая разные модули, которая позволяет получить информацию как о текущем словарном составе русского языка, так и о его истории на протяжении почти трехсот лет. Минобрнауки выступает оператором и разработчиком проекта, работы над ним ведутся ...
...4 апреля в пресс-центре ТАСС состоялась пресс-конференция...
Чтобы возникла лаконичная и удобная система Брайля, понадобилось объединить достижения человеческой мысли в разных областях: идеи просветителей, усилия педагогов, мастерство криптографов. Спустя двести лет шрифт Брайля не устарел и сегодня востребован в цифровом мире.
...Чтобы возникла лаконичная и удобная система Брайля...
...Новаторы XIX века В 1824 году пятнадцатилетний...
Библиотека по естественным наукам Российской академии наук приглашает на лекцию «Кириллица vs буквица: как на самом деле появился славянский алфавит?». Слушатели узнают о том, была ли у славян письменность до Кирилла и Мефодия; как и почему возникли и укрепились мифы о славянской письменности и какова настоящая история нашего алфавита. Лектор — Светлана Гурьянова, филолог, популяризатор лингвистики, автор книги «В начале было кофе» (вошла в ...
...Библиотека по естественным наукам Российской академии...
Берестяные грамоты служили жителям древнего Новгорода универсальным средством коммуникации. На них писали извещения, квитанции, учебные прописи, любовные письма и другие личные послания. Эти грамоты — ценнейший источник информации о живом языке того времени, в том числе — просторечном и грубом. Об обсценной лексике в берестяных грамотах расскажет Светлана Гурьянова — филолог, преподаватель русского языка, популяризатор лингвистики, автор книги «В начале ...
...Берестяные грамоты служили жителям древнего Новгорода...
Даже сегодня, общаясь с теми, кто родился в 1930-е и 1940-е годы (как правило, коренными москвичами), мы отмечаем, что они произносят некоторые слова не так, как мы привыкли. В чем своеобразие старомосковской орфоэпической традиции и как она соотносится с современными нормами? Ответить на эти и другие вопросы Грамоте помогла кандидат филологических наук, старший научный сотрудник отдела фонетики Института русского языка имени В. В. Виноградова РАН Ольга Антонова.
...Даже сегодня, общаясь с теми, кто родился в ...
...Кто и когда говорил по-старомосковски Живой язык...
Почему кодификация кофе в среднем роде вызывает такое отторжение? Действительно ли мы обязаны жить в Колпине и вылетать из Шереметьева и кто придумал эти нормы? Когда словари легализуют ударение звóнишь и стоит ли этого бояться? Угрожают ли русскому языку заимствования, жаргонизмы и обсценная лексика, или тезис о «порче языка» несостоятелен? Руководитель справочной службы Грамоты, старший научный сотрудник Института ...
...Почему кодификация кофе в среднем роде вызывает...
По случаю обновления Грамоты мы решили напомнить нашим читателям, как появился этот интернет-ресурс, как он развивался и в чем всегда оставался верен себе. Об основных вехах долгой истории Грамоты расскажет свидетель и один из главных участников событий, научный сотрудник Института русского языка им. В. В. Виноградова РАН, многолетний главный редактор, а ныне научный руководитель Грамоты Владимир Маркович Пахомов.
...По случаю обновления Грамоты мы решили напомнить нашим...
...«Если книг читать не будешь, скоро грамоту забудешь...