Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...mdash; это получить список векторов слов, наиболее похожих...
...Скажем, если мы возьмем слово теплый, то очень похожий...
...Поэтому специалисты не говорят, что похожие векторы...
Возможно, метафоры и нарративы — не первое, что приходит на ум, когда мы думаем про рынки и инвестиции. Но экономика завязана на обмене информацией, и лексика или тональность новостных сообщений играют в экономическом взаимодействии более существенную роль, чем кажется на первый взгляд. Грамота рекомендует несколько публикаций издания «Эконс», которые показывают отношения между языком и экономикой с неожиданной стороны.
...Возможно, метафоры и нарративы — не...
...между языками — то, насколько один из них похож...
...а восприятие читателем экономических моделей похоже...
Есть целый ряд фамилий, которые образованы от имен нарицательных: Соловей, Турок, Стрелец, Заяц, Рыбачок, Лев и многие другие. Во многих случаях у носителей русского языка возникает затруднение — нужно ли их склонять? И если да, то как именно: Скитальца или Скиталеца, Орленка или Орленока? Ответ на этот вопрос не столь однозначен, как может показаться.
...Есть целый ряд фамилий, которые образованы от имен...
...Проблема заключается в том, что омонимичные или похожие...
...выпадения беглого гласного (под влиянием склонения похожих...
Из всех вопросов, на которые справочная служба Грамоты ответила в апреле, мы выбрали три, которые многим могут быть интересны. В них пользователи спрашивают про отдельные слова и формы, но, по сути, затрагивают более широкие проблемы: склонение существительных, омонимию падежей и орфографическое освоение иностранных заимствований.
...Из всех вопросов, на которые справочная служба Грамоты...
... Похожая ситуация возникает со словами...
...Если мы считаем, что робот похож на человека, наделяем...
После того как в среду, 22 ноября, портал Грамоты был перезапущен в новом дизайне и с новой поисковой системой, команда внимательно следила за реакцией пользователей. Анализ обратной связи позволяет нам совершенствовать работу портала. Вот некоторые изменения, которые были внесены: большинство ссылок и редиректов стали работать корректно; снижен порог, отсекающий в выдаче нерелевантные ответы справочной службы, — теперь пользователи видят гораздо больше ответов;
...варианты написания слова или находить сразу группу похожих...
Команда Грамоты за прошедшую неделю внесла несколько обещанных изменений в работу обновленного портала: размер поля для вопроса справочной службе увеличился до 1000 символов; добавлена возможность использовать в поисковой строке символы (* и ?), что позволяет искать в текстовых материалах сразу группу похожих слов; для большинства словарей в словарных статьях, которые появляются в результатах поиска, воспроизводится их исходная разметка. Кроме того, мы теперь с ...
...позволяет искать в текстовых материалах сразу группу похожих...
Эвфемизмы, или слова-заместители, мы употребляем в тех случаях, когда слово, которое напрашивается в этом контексте, считается непристойным, оскорбительным или неуместным по каким-то другим причинам. И такие «мягкие» формулировки появляются не только на месте ругательств — эвфемизмами заменяют и многие другие лексические единицы. Для каких групп слов они используются чаще всего? Попробуем показать отдельные фрагменты этой большой картины.
...Эвфемизмы, или слова-заместители, мы употребляем в&...
...Похожие эвфемизмы есть во многих языках, в том...
...rsquo;), имея в виду болезнь на букву С (похожим...
...Похожая история происходит и с русскими словами...
Люди давно поняли, что записывать слова от руки — слишком трудоемкий процесс. Чтобы быстро делиться большими объемами информации, нужно было этот процесс упростить и ускорить. И вот примерно полтора века назад решение было найдено. С тех пор человечество стучит по клавишам.
...Люди давно поняли, что записывать слова от руки &mdash...
...Генри Милль в 1714 году изобрел устройство, похожее...
...Это устройство было похоже скорее на ксерокс, чем на...
...чтобы сделать ее удобнее, пока не появился вариант, похожий...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...собирать их много лет или искусственно создать данные, похожие...
...отметили ошибки, — создай еще миллион похожих...
...Сейчас языковые модели скорее похожи на прилежных иностранцев...
Короткое слово «пока» настолько нам привычно, что без него не обходится ни одно повседневное расставание близких или хорошо знакомых друг с другом людей. Но так было не всегда. Историю превращения этого маленького слова из наречия в способ неформального прощания рассказывает лингвист Ирина Фуфаева.
...Короткое слово «пока» настолько нам привычно...
...Пока до свидания, конечно, уже меньше похоже на свободные...
... Королевские размышления (1914) Похоже, что...