Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Каждый из нас общается по-разному в зависимости от ситуации и статуса собеседника. Невозможно говорить с начальником так же, как со своим приятелем. Точно так же подчеркнутая и несколько формальная вежливость неуместна в компании близких друзей. Каким образом вежливость проявляется на уровне языка? И в чем тут своеобразие разных языков?
...Каждый из нас общается по-разному в зависимости...
...Западная вежливость В лингвистике грамматическая...
В России бок о бок с русскими столетиями живут другие коренные народы. Неизбежное в такой ситуации культурное взаимовлияние отразилось и на языке. Известно, что такие слова, как «казна», «деньги», «таможня» и многие другие, имеют тюркское происхождение и связаны с ордынским владычеством. А какие заимствованные из русского языка слова вошли в языки народов России? Для примера возьмем якутский, татарский, чеченский и коми-пермяцкий языки.
...В России бок о бок с русскими столетиями живут другие...
...Русский язык, будучи государственным, не мог не повлиять...
На нашем портале появился новый раздел «Издательство». Теперь цифровая платформа «Грамота.ру» — это не только справочная служба, поиск по электронным словарям и справочникам, журнал для чтения и интерактивный учебник, но еще и книги. Какие книги издаются под брендом Грамоты сейчас и какие появятся в будущем? Мы расспросили об этом главного редактора издательства, кандидата филологических наук Ольгу Згировскую.
...На нашем портале появился новый раздел «Издательство...
...Грамота: Что для вас самое главное в Грамоте как...
Наверняка многие задумывались: «Почему изба — она, дом — он, а здание — оно?» Не все могут четко объяснить, в чем разница между родом и полом, говоря: «Это слово мужского пола». Лингвисты признаю́т, что род — одна из самых загадочных и нелогичных грамматических категорий. Что думает о ней наука и какие проблемы эта категория создает на практике?
...Наверняка многие задумывались: «Почему изба ...
...Как появился род На первый взгляд грамматический род...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...
Знать правила расстановки кавычек необходимо не только школьникам и писателям, но и тем, кто составляет договоры, инструкции, экспликации для выставок, объявления. Общие принципы усвоить нетрудно, а вот умение применять их к месту достигается тренировкой. В сложных случаях пригодится языковое чутье и внимательное отношение к стилю.
...Знать правила расстановки кавычек необходимо не только...
...Виды кавычек В русской (и не только) пунктуации есть...
Путешественники знают, что местные жители часто с готовностью рассказывают приезжим, как появилось название их деревни или реки. Эти версии часто бывают далеки от истины, но отсутствие надежных научных сведений компенсируется фантазией. Сюжеты, впрочем, возникают не на пустом месте, а с опорой на отрывочные исторические сведения и предания.
...Путешественники знают, что местные жители часто с готовностью...
...Находчивость вместо памяти Коллективная память как...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Поводом для дискуссии стал публичный отказ издательства «Альпина нон-фикшн» изменить свое название в пользу варианта, зафиксированного еще в 2012 году в «Русском орфографическом словаре». Этот яркий частный случай — часть большой проблемы соотношения нормы и узуса. Но почему именно в словах типа «нон-фикшен», «ресепшен» и «фешен» словарный вариант написания вызывает сопротивление? Грамота решила поговорить об этом со специалистами.
...Поводом для дискуссии стал публичный отказ издательства...
...Группа слов с общей судьбой Есть целая группа...