Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Русское правописание за десять с лишним веков менялось много раз, но, говоря о реформе орфографии, мы всегда имеем в виду реформу 1917 года. При этом внесенные в правописание изменения обсуждались русскими лингвистами задолго до самой реформы.
...Русское правописание за десять с лишним веков менялось...
...Первые перемены Рефлексия на тему орфографии у наших...
В этом году чемпионат проходит в России в четвертый раз. Это не совсем обычное соревнование: подростки могут здесь написать эссе по математике, трактат по физкультуре или концепцию музыкального фестиваля. О том, зачем понадобилась альтернатива школьному «итоговому сочинению», рассказал председатель экспертного жюри, доцент факультета гуманитарных наук НИУ ВШЭ и руководитель Лаборатории развития интеллектуальных состязаний Михаил Павловец.
...В этом году чемпионат проходит в России в четвертый...
...Грамота: В чем особенность вашего чемпионата, чем он...
10 апреля на сайте «Тотального диктанта» открылась регистрация участников акции. При регистрации нужно выбрать город (и площадку, на которой проводится акция) или онлайн-участие. Например, чтобы увидеть список площадок в Москве, нужно перейти в раздел «Площадки». Их расположение также можно посмотреть на карте. Рядом с названиями площадок указаны их особенности (есть инклюзивные — для участников с ограничениями по зрению ...
...10 апреля на сайте «Тотального диктанта...
Предлагаем вниманию читателей портала статью профессора Льва Владимировича Щербы, опубликованную в журнале «Русский язык в школе» (№ 5, 1936). Мысли о будущем языка, высказанные Л. В. Щербой восемьдесят лет назад, и сегодня не утратили актуальности.
...Предлагаем вниманию читателей портала статью профессора...
...Предисловие «Грамоты.ру» Лев Владимирович...
Почему в речи сохраняются разные орфоэпические варианты некоторых слов и зачем словари их фиксируют? Ответы дает статья в журнале «Наука и жизнь».
...Почему в речи сохраняются разные орфоэпические варианты...
...Различные произносительные варианты слов, такие как...
В последнее время все чаще высказывается мнение о том, что слово «Интернет» надо писать со строчной (маленькой) буквы. Основной аргумент сторонников такого написания: Интернет стал единой, всемирной, общераспространенной информационной сетью, таким же общепринятым средством передачи информации, как, например, телефон.
...В последнее время все чаще высказывается мнение о том...
...Пишем же мы это слово со строчной буквы! Но справедлива...
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Ключевые слова в научных статьях, монографиях...
Статья научного консультанта Грамоты Владимира Пахомова в журнале «Неофилология» рассказывает о жизненном пути, научном и просветительском наследии Михаила Панова — лингвиста, педагога, популяризатора науки, в 1960-е годы — заместителя председателя Орфографической комиссии.
...Статья научного консультанта Грамоты Владимира Пахомова...
...Реформа русской орфографии, которая готовилась в ...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...