Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Выбором «слова года» занимаются авторитетные словари, языковые институты, газеты и сайты. С недавнего времени такую акцию проводит и Грамота. Чем отличается наш подход к определению «слова года»? Как мы собираем данные, фильтруем и оцениваем их? Приоткрываем дверь на нашу социолингвистическую кухню. И предупреждаем: у большого «слова года» будет свита из «главных слов» в разных сферах.
...Выбором «слова года» занимаются авторитетные...
...Вторые «выборы»: развиваем методологию...
В России бок о бок с русскими столетиями живут другие коренные народы. Неизбежное в такой ситуации культурное взаимовлияние отразилось и на языке. Известно, что такие слова, как «казна», «деньги», «таможня» и многие другие, имеют тюркское происхождение и связаны с ордынским владычеством. А какие заимствованные из русского языка слова вошли в языки народов России? Для примера возьмем якутский, татарский, чеченский и коми-пермяцкий языки.
...В России бок о бок с русскими столетиями живут другие...
...Русский язык, будучи государственным, не мог не повлиять...
Когда ребенок русскоязычных родителей рождается вне России и оказывается в ситуации двуязычия, где лингвистическое внимание малыша распределяется между двумя и более языками, русский язык оказывается скорее «домашним» языком, нежели общеупотребительным. В этом случае русский язык может сохраниться как родной лишь при том условии, что он наполнится необходимым дополнительным личностным содержанием.
...Когда ребенок русскоязычных родителей рождается вне...
...Для свободного владения языком мало просто понимать...
По случаю обновления Грамоты мы решили напомнить нашим читателям, как появился этот интернет-ресурс, как он развивался и в чем всегда оставался верен себе. Об основных вехах долгой истории Грамоты расскажет свидетель и один из главных участников событий, научный сотрудник Института русского языка им. В. В. Виноградова РАН, многолетний главный редактор, а ныне научный руководитель Грамоты Владимир Маркович Пахомов.
...По случаю обновления Грамоты мы решили напомнить нашим...
...«Если книг читать не будешь, скоро грамоту забудешь...
Когда мы говорим «словарь», какие издания приходят в голову прежде всего? Наверняка кто-то вспомнит словари Даля, Ожегова и Ушакова, филологи назовут словарь Фасмера, люди старшего поколения — энциклопедию Брокгауза и Ефрона. Словарные статьи в нашем представлении обычно начинаются со слова или словосочетания и следуют друг за другом в алфавитном порядке. Но есть словари, которые устроены совсем иначе: в них единицы отобраны и организованы в единое целое по другим принципам.
...Когда мы говорим «словарь», какие издания...
...Что нового могут придумать лексикографы Лексикография...
Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.
...Кажется, что машины начали вести с нами диалог...
...Работа по сценарию Разработчики будущих чат-ботов...
Знать правила расстановки кавычек необходимо не только школьникам и писателям, но и тем, кто составляет договоры, инструкции, экспликации для выставок, объявления. Общие принципы усвоить нетрудно, а вот умение применять их к месту достигается тренировкой. В сложных случаях пригодится языковое чутье и внимательное отношение к стилю.
...Знать правила расстановки кавычек необходимо не только...
...Виды кавычек В русской (и не только) пунктуации есть...
Ной Вебстер родился 16 октября 1758 года и прожил 84 года. За это время он успел организовать несколько школ и реформировать систему образования, затронуть в своей публицистике множество актуальных социальных и научных вопросов, внести заметный вклад в политическую жизнь Америки и остаться в истории двумя уникальными печатными трудами: «Пособием по американскому правописанию» и «Американским словарем английского языка».
...Ной Вебстер родился 16 октября 1758 года и прожил 84...
...Не только словарь За свою долгую жизнь Ной Вебстер...
Фразеология часто оказывается самой непонятной частью языка не только для иностранцев, но и для младших поколений, которые редко встречали и никогда не употребляли выражения вроде «семь пятниц на неделе». Многие идиомы кажутся устаревшими и ассоциируются с речью бабушек и дедушек. Но никогда не поздно разобраться, какой смысл имеют истории про белок, комаров, баранов и молочные реки, даже если вы сами использовать эти выражения не собираетесь. Мы выбрали семь идиом, которые чаще других ищут на Грамоте — и не находят! Самое время дополнить Справочник по фразеологии.
...Фразеология часто оказывается самой непонятной частью...
...Крутиться как белка в колесе Образ. Белка, которая...