Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Стартап Metamentor, основанный студентами МФТИ, создал систему обработки рукописей на базе генеративного искусственного интеллекта. Система уже несколько месяцев тестируется в издательстве «Эксмо». «Алгоритмы анализируют синтаксическую сложность каждого произведения, разнообразие лексики, распознают фрагменты текста, требующие корректировки, исключения или добавления возрастной маркировки в соответствии с действующим законодательством ...
...Стартап Metamentor, основанный студентами МФТИ...
Пунктуационная асимметрия — давно известная переводчикам проблема: системы знаков препинания в разных языках не совпадают ни функционально, ни стилистически. Французская пунктуация, например, традиционно более сдержанна, чем русская, где восклицательный знак может выражать не только эмоции, но и вежливость («Спасибо!», «Добрый день!»). Машинный перевод пока плохо учитывает эти тонкости, механически перенося знаки из языка в язык или ...
...Пунктуационная асимметрия — давно известная переводчикам...
Аналитический центр ВЦИОМ представил результаты исследования «Чисто по-русски», посвященного отношению общества к иностранной лексике и новым законодательным инициативам в сфере языка. Оно основано на данных телефонного опроса 7 марта 2026 года. 61% респондентов убеждены, что заимствовать иностранные слова не следует, и высказываются за поиск или создание слов русского языка. 28% (+5 процентных пунктов в сравнении с 2021 годом) согласны с ...
...Аналитический центр ВЦИОМ представил результаты исследования...
Закон о защите русского языка был внесен в Госдуму еще в октябре 2023 года и вызвал бурное обсуждение. В первом варианте предлагалось ввести запрет на использование заимствованных слов вроде coffee или sale в названиях объектов, на вывесках, этикетках и даже в СМИ. Однако против таких ограничений возражали в предпринимательской среде: требование не использовать латиницу и переводить зарегистрированные иностранные названия могло вступать в противоречие с уже существующими правами на такие ...
...Закон о защите русского языка был внесен в Госдуму...
Гендерная проблематика явилась для лингвистики последних десятилетий подлинным открытием, хотя для ряда языков (например, японского, корейского, чукотского и др.) разделение языка на мужской и женский варианты было обыденным явлением, незаметным, как воздух, которым дышит человек (конечно, до поры до времени незаметным).
...Гендерная проблематика явилась для лингвистики последних...
...Европейские языковеды наперегонки бросились открывать...
Когда язык заимствует новое слово, его правописание и произношение не всегда очевидно и может варьироваться: например, нон-фикшен и нонфикшн, фэнтези и фентези… Мы составили список «проблемных» слов, которые часто ищут на Грамоте, чтобы напомнить, какова для них текущая орфографическая норма. И попробовали выявить закономерности или хотя бы подсказки, которые помогают предвидеть, как поведет себя заимствованное слово в русском языке.
...Когда язык заимствует новое слово, его правописание...
...1. Шорт-лист В чем сложность: раздельно, слитно или...
Принципы коммуникативной эффективности и основы права требуют, чтобы законы были понятны обывателям, однако эмпирические данные свидетельствуют о том, что юридические документы в основном непонятны как юристам, так и неспециалистам. Как известно, законы содержат поразительно высокий уровень сложных синтаксических структур по сравнению с другими жанрами текстов. В исследовании, опубликованном в PNAS, ученые из США, Великобритании и Австралии ...
...Принципы коммуникативной эффективности и основы...
Серия из четырех книг написана кандидатами филологических наук, сотрудниками отдела культуры русской речи Института русского языка им. В. В. Виноградова РАН Еленой Арутюновой, Еленой Бешенковой и Ольгой Ивановой. Ссылки на полный текст всех книг в формате pdf выложены на сайте академического орфографического ресурса «Академос» на странице библиографического указателя (в подразделе «Собрания правил Е. В. Бешенковой и О. Е. Ивановой»). Комментарии будут полезны филологам, корректорам, преподавателям и учащимся, а также всем, кого интересуют проблемы современной русской орфографии.
...Серия из четырех книг написана кандидатами филологических...
...Первая книга называется «Употребление гласных...
29 апреля 2025 года исполнилось бы 90 лет замечательному отечественному лингвисту Андрею Анатольевичу Зализняку. В Институте русского языка имени В. В. Виноградова РАН в этот день проходят мемориальные чтения, посвященные этому юбилею. А мы напоминаем о самых известных книгах и выступлениях Андрея Анатольевича.
...29 апреля 2025 года исполнилось бы 90 лет замечательному...
...1. Популярные лекции разных лет Лекции о новгородских...