Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
Вы приглашены на урок орфографии! Его ведут сотрудники отдела культуры русской речи Института русского языка им. В. В. Виноградова РАН, члены Орфографической комиссии РАН заместитель главного редактора портала «Грамота.ру» Елена Арутюнова и главный редактор портала Владимир Пахомов.
...Вы приглашены на урок орфографии! Его ведут сотрудники...
...Авторы недавно вышедшего из печати «Объяснительного...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Может ли язык, используемый журналистами, повлиять на то, как будут восприниматься утверждения, вынесенные в заголовок новости? Очевидно, что может, поэтому заголовкам СМИ всегда уделяли много внимания. Оказалось, что для сообщений о научных фактах выбор слов тоже важен. Ученые давно знают? Ученые считают? Ученые уверены? Исследователи из Стэнфордского университета выяснили: выбор формулировки может существенно влиять на то, как читатель воспримет информацию: будет ли он ...
...Может ли язык, используемый журналистами, повлиять...
Слова пожалуйста и спасибо считаются универсальными составляющими вежливого общения. Мы привыкли думать, что эти слова следует употреблять независимо от обстоятельств, просто потому, что так принято. Но исследователи из Калифорнийского университета в Лос-Анджелесе выяснили, что в практике употребления слова пожалуйста гораздо больше нюансов, чем может показаться на первый взгляд. Авторы работы, опубликованной в журнале Social Psychology Quarterly, записали на видео ...
...Слова пожалуйста и спасибо считаются универсальными...
Первая основана на результатах диалектологической экспедиции во Владимирскую область, а вторая иллюстрирует на разных примерах такое языковое явление, как синтаксическая редупликация.
...Первая основана на результатах диалектологической экспедиции...
...Муромское ёканье Примеры, которые собрали лингвисты...
Сложно организованные сообщества требуют сложных систем коммуникации. Хотя многие животные выработали свои способы обмена информацией, можно ли сказать, что хоть один из видов приблизился в этом к людям? Исследователи из Лаборатории искусственного интеллекта Массачусетского технологического института и международной инициативы CETI изучили вокализации (звуковые сигналы) кашалотов и пришли к выводу, что они похожи на настоящий язык. Авторы работы отталкивались от ...
...Сложно организованные сообщества требуют сложных систем...
Генеративные модели искусственного интеллекта позволяют создавать изображения, текст, звуки и видео, используя обычные текстовые команды. В том числе их нередко используют для написания сочинений и эссе. Московский городской педагогический университет (МГПУ) решил легализовать эту практику. Ученый совет МГПУ в конце августа 2023 года принял решение разрешить студентам использовать технологии искусственного интеллекта при подготовке выпускных квалификационных работ. При ...
...Генеративные модели искусственного интеллекта позволяют...
Исследователи из университета Нью-Мексико в Альбукерке (США) сопоставили фонетические особенности более 1000 языков мира с данными об условиях окружающей среды там, где на них говорят. Статья об этом исследовании опубликована в журнале Frontiers in Language Sciences. В работе учитывались такие факторы, как влажность, высота над уровнем моря, температура, количество осадков, плотность растительности. В результате были обнаружены любопытные закономерности. В регионах с высокими ...
...Исследователи из университета Нью-Мексико в Альбукерке...