Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В русском языке глагол-сказуемое согласуется с подлежащим по лицу и числу в настоящем времени и по роду и числу в прошедшем. Когда подлежащее выражено одним словом — существительным или местоимением, с согласованием не возникает проблем. Но если подлежащее нетипичное, возможны разные варианты. Применить корпусные методы к таким конструкциям сложно, потому что в корпусе они почти не встречаются. Но можно изучать их методами экспериментального синтаксиса.
...В русском языке глагол-сказуемое согласуется с подлежащим...
...Три стратегии выбора Мы будем рассматривать случаи...
Разными исследователями, как нашими, так и зарубежными, неоднократно отмечалось, что дети, осваивающие какой-либо язык как родной (первый), и носители другого языка (инофоны), осваивающие тот же язык как второй, иногда допускают сходные ошибки, что, по-видимому, должно свидетельствовать о том, что стратегия построения первичной и вторичной языковой системы в определенном смысле совпадает. Однако, когда сопоставляются достаточно большие корпусы ошибок, это не подтверждается: среди ошибок, допускаемых инофонами, можно обнаружить некоторое количество «детских», но дети обычно не допускают ошибки, свойственные инофонам. Таким образом, можно говорить о несовпадении стратегий усвоения языка.
...Разными исследователями, как нашими, так и зарубежными...
...В качестве хорошо известных фактов можно привести правила...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...В 2024 году Национальному корпусу русского языка...
В разных контекстах Вильгельм фон Гумбольдт подчеркивал различные аспекты языка. Отсюда — его разные определения. В контексте же настоящей статьи для нас имеют главное значение два гумбольдтовских понимания языка — деятельностно-речевое («Язык есть деятельность») и системно-знаковое («Язык есть система знаков»). Из первого из них вытекает возможность проследить, в каком соотношении в учении Гумбольдта находятся семасиологизм и ономасиологизм, а из второго — в каком соотношении в нем представлены язык и речь.
...В разных контекстах Вильгельм фон Гумбольдт подчеркивал...
...В отличие от Фердинанда де Соссюра (1857&ndash...
Вежливость в моем представлении встроена в речь гораздо глубже, чем соблюдение речевого этикета; она предполагает не только правильный выбор этикетных знаков, но и навык использования коммуникативных стратегий.
...Вежливость в моем представлении встроена в речь...
...Вот уже несколько десятилетий лингвистика находится...
Один из проектов обновленной Грамоты — Лексикон. В него попадают новые слова, которые уже вызывают живой интерес у наших пользователей (и не только), но еще не фиксируются академическими словарями. Как выбирать и описывать такие слова — вопрос, который сегодня актуален для портала. Эксперты и сотрудники Грамоты постарались ответить на него в режиме живой дискуссии. Предлагаем вам познакомиться с высказанными идеями.
...Один из проектов обновленной Грамоты — Лексикон...
...Зачем нужен Лексикон? Рабочий термин «Лексикон...
За два века слово может изменить свое значение до неузнаваемости. Многие слова, которыми мы пользуемся сегодня, совершенно иначе воспринимались нашими предками, пишет «Системный Блокъ». Тест на лингвистическую интуицию: сможете ли вы догадаться, когда возникла поговорка «голод не тетка», а слово «молодец» стало похвалой?
...За два века слово может изменить свое значение до неузнаваемости...
...Любой язык со временем меняется. Даже слова, которые...
Как хорошо вы замечаете ошибки? Давайте проверим, сможете ли вы работать корректором. Мы взяли предложения из корпуса «Русская классика» Национального корпуса русского языка и добавили в них ошибки. Будьте внимательны: мы хотели усложнить вам задачу, поэтому в разных предложениях вы встретите разные ошибки. Иногда это орфографическая ошибка, иногда — пунктуационная, иногда — грамматическая. В каждом из десяти вопросов только одно предложение не содержит ошибок. Сможете ли вы его найти?
...Как хорошо вы замечаете ошибки? Давайте проверим, сможете...
Ведущий подкаста «Сложное предложение» лингвист Игорь Исаев пригласил авторов книги «Запретные слова», докторов филологических наук Анатолия Баранова и Дмитрия Добровольского поговорить о русском мате: его изучении, его уместности и его табуированности. Грамота изложила близко к тексту фрагменты этого разговора.
...Ведущий подкаста «Сложное предложение»...
...Игорь Исаев: Зачем было писать эту книгу? Дмитрий...