Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Предлагаем вашему вниманию интервью с известным психологом и журналистом, преподавателем факультета журналистики МГУ Владимиром Владимировичем Шахиджаняном.
...Предлагаем вашему вниманию интервью с известным психологом...
...Грамота: Владимир Владимирович, обычно Грамота отвечает...
Ученый совет Института русского языка РАН утвердил к печати 30-й том «Этимологического словаря славянских языков» под редакцией академика О. Н. Трубачева, который реконструирует праславянский лексический фонд.
...Ученый совет Института русского языка РАН утвердил...
...Словарь, построенный на устных и письменных данных...
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Что такое Национальный словарный фонд: концепция и...
Пока все ждали, что искусственный интеллект вытеснит гуманитариев, работающих с текстами, произошло обратное: именно они становятся незаменимыми специалистами в обучении нейросетей. Спрос на AI-тренеров — профессионалов, которые учат искусственный интеллект правильно общаться с людьми, — вырос почти вдвое за год, по данным сервиса по поиску работы и сотрудников HeadHunter. Задача ИИ-тренера — готовить обучающие данные, создавать ...
...Пока все ждали, что искусственный интеллект вытеснит...
Проблема различения языка и диалекта не перестает быть актуальной для взаимоотношений разных народов и стран. От лингвистов требуют предъявить строгие научные критерии разграничения этих понятий, но в действительности едва ли не большую роль играют экстралингвистические факторы.
...Проблема различения языка и диалекта не перестает быть...
...Задача с двумя неизвестными Представим, что есть два...
Многие уверены, что реформа орфографии 1917–1918 годов задумана и подготовлена большевиками. Но сегодня у нас есть возможность объективной оценки событий прошлого. На самом деле современная орфография — не следствие большевицкого произвола и насильственного упрощения языка, а результат многолетней работы лучших русских языковедов, направленной на совершенствование правил правописания.
...Многие уверены, что реформа орфографии 1917–1918&...
...Реформа 1917–1918 годов, в результате...
Развитие лексики русского языка не только определяется внутрисистемными интенциями, но и находится под ощутимым давлением со стороны социальных факторов. Помимо появления новых реалий, требующих наименования, переосмысления уже существующих фактов действительности, поиска новых средств выразительности возникновение новых слов и значений может быть вызвано и напрямую определенными социальными событиями, катаклизмами.
...Развитие лексики русского языка не только определяется...
...Наименования таких событий становятся «ключевыми...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
По случаю обновления Грамоты мы решили напомнить нашим читателям, как появился этот интернет-ресурс, как он развивался и в чем всегда оставался верен себе. Об основных вехах долгой истории Грамоты расскажет свидетель и один из главных участников событий, научный сотрудник Института русского языка им. В. В. Виноградова РАН, многолетний главный редактор, а ныне научный руководитель Грамоты Владимир Маркович Пахомов.
...По случаю обновления Грамоты мы решили напомнить нашим...
...«Если книг читать не будешь, скоро грамоту забудешь...