Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Мы уже давно научились объяснять компьютеру грамматику и другие уровни языка, а вот с семантикой были проблемы....
Когда мы говорим «словарь», какие издания приходят в голову прежде всего? Наверняка кто-то вспомнит словари Даля, Ожегова и Ушакова, филологи назовут словарь Фасмера, люди старшего поколения — энциклопедию Брокгауза и Ефрона. Словарные статьи в нашем представлении обычно начинаются со слова или словосочетания и следуют друг за другом в алфавитном порядке. Но есть словари, которые устроены совсем иначе: в них единицы отобраны и организованы в единое целое по другим принципам.
...Когда мы говорим «словарь», какие издания...
...Самые необычные словари русского языка: от морфем до...
... Во-первых, помимо лексики могут рассматриваться другие уровни языка: морфология, грамматика, фразеологизмы и крылатые слова. В центре внимания могут оказаться также лексические системные связи: оксюмороны, синонимы, антонимы, семантические поля, объединенные в тезаурус....