Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Разные словари необходимы для разных задач. Какими-то пользуются только специалисты, другие нужны тем, кто так или иначе работают с языком, — учителям, школьникам, студентам, редакторам, публицистам. Расскажем о пяти самых востребованных типах словарей для широкого круга пользователей: толковом, орфографическом, словаре ударений, двуязычном и словаре синонимов.
...Разные словари необходимы для разных задач. Какими-то...
...Изначально словари были рукописными, малого объема...
И пользователи Грамоты, и те, кто предпочитает бумажные издания, часто замечают, что один словарь рекомендует одно ударение, другой — другое, а третий вообще приводит оба варианта как равноправные. Если один словарь разрешает «кофе» в среднем роде, а другой возражает против такой вольности, кому верить? Ответ неочевиден, поскольку универсального словаря на все случаи жизни не существует. Более того, не все словари ставят перед собой задачу зафиксировать строгую норму. Как же тогда выбрать правильный вариант, какие критерии использовать, на что обращать внимание? Попробуем разобраться.
...И пользователи Грамоты, и те, кто предпочитает бумажные...
...Словари прескриптивные и дескриптивные Литературная...
Узбекистан начинает играть все более убедительную роль в регионе, и не только в экономике, но и во внимании к образованию, к воспитанию молодежи и поддержанию традиций, к развитию всесторонних культурных связей. Такой подход отразился и в размахе, с которым была подготовлена и открыта 3-я Международная Ташкентская книжная ярмарка. О своих впечатлениях рассказывает генеральный директор центра «Златоуст» Станислав Голубев. — При всем том, что она проходила лишь в ...
...Узбекистан начинает играть все более убедительную роль...
Что за напасть? Почему столько иностранных слов почти в каждом предложении, печатном или произнесенном в радио- и телеэфире? Зачем нам имидж, если есть образ, к чему саммит, если можно сказать «встреча в верхах»? Чем модный нынче в кинематографии римейк лучше обычной переделки? И разве консенсус прочнее согласия?
...Что за напасть? Почему столько иностранных слов почти...
...Читаю газеты: Участники саммита пришли к консенсусу...
Исследователи из университета Нью-Мексико в Альбукерке (США) сопоставили фонетические особенности более 1000 языков мира с данными об условиях окружающей среды там, где на них говорят. Статья об этом исследовании опубликована в журнале Frontiers in Language Sciences. В работе учитывались такие факторы, как влажность, высота над уровнем моря, температура, количество осадков, плотность растительности. В результате были обнаружены любопытные закономерности. В регионах с высокими ...
...Исследователи из университета Нью-Мексико в Альбукерке...
Ошибки, связанные с паронимами, — одни из самых частых в речи. Даже люди, чья профессия связана со словом и публичными выступлениями, время от времени допускают их. Паронимы коварны, но можно научиться использовать их аккуратно — если понимать, как они образуются и какие оттенки смысла передают.
...Ошибки, связанные с паронимами, — одни...
...Что такое паронимы Так называют слова, похожие на...
«О составлении „Этимологического словаря русского языка“ как о главной цели своей научной деятельности я мечтал еще во время первых исследований, посвященных влиянию греческого языка на славянские (1906-1909), — писал Макс Фасмер о своем труде. — Многие пожелания, высказанные в рецензиях на мой словарь, несомненно, будут полезными для последующего русского этимологического словаря, в котором должно быть уделено особое внимание многочисленным словам, названным здесь неясными. Если бы мне пришлось начать работу снова, я уделил бы большее внимания калькам и семасиологической стороне».
...«О составлении „Этимологического словаря...
...Известный ученый-славист В. Кипарский, пытаясь...
Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...До нас дошел очень большой массив рукописей на церковнославянском...
Россияне за последний год стали читать больше книг в онлайн-библиотеках: трафик этих сервисов увеличился на 50%. Такие данные порталу AdIndex предоставил интернет-провайдер Yota. Самым популярным ресурсом по объему трафика стал «Литрес». На втором месте идет Bookmate, этот сервис показал самый большой рост трафика. Замыкает первую тройку MyBook. Общее число пользователей всех подобных платформ выросло на 1%. Каждый третий пользователь входит в категорию 26–35
...Россияне за последний год стали читать больше книг...