Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Написание и редактура текстов, работа с информацией и с аудиторией перестали быть уделом избранных, навыки и знания, необходимые для этого, сейчас нужны каждому. Но если интерес к русскому языку объединяет представителей разных поколений, представления о норме и стиле у них могут отличаться. Мы собрали несколько каналов на любой вкус — интересных и иногда неожиданных. Есть из чего выбрать то, что понравится и принесет пользу.
...Написание и редактура текстов, работа с информацией...
...1. Лингвист 126,2 тыс. подписчиков. «...
Грамота решила не ограничиваться в 2024 году толкованием слова вайб и проделала аналогичную работу с теми словами, которые особенно часто появлялись в запросах наших пользователей. Это имена существительные маркетплейс, стендап, буллинг, худи, чекап, инфлюенсер, абьюз, абьюзер, вишлист, гойда, кипиш, кринж, а также имена собственные «Ютуб» и «Ватсап», которые получили широкое распространение и фактически употребляются как нарицательные. На примере пяти новых слов мы покажем, что у нас получилось.
...Грамота решила не ограничиваться в 2024 году толкованием...
...В лаборатории лексикографа В рамках проекта «...
Сразу несколько представителей профильных ведомств в последние дни призвали ужесточить требования к тому уровню, на котором мигранты владеют русским языком. В частности, об этом заявил на пресс-конференции 24 июня заместитель руководителя Федерального агентства по делам национальностей Станислав Бедкин. А спустя три дня на эту тему высказался руководитель Федеральной службы по надзору в сфере образования и науки (Рособрнадзора) Анзор Музаев в ходе ...
...Сразу несколько представителей профильных ведомств...
За последние несколько недель прошла волна мероприятий и публикаций по поводу русского языка, словно давняя озабоченность наконец-то оформилась в конкретные мысли и отчетливые намерения. Это прежде всего акция «Народный диктант», инициаторы которой — журналисты «Российской газеты» — поставили эксперимент на себе и тем самым заслужили право предложить проверить свои знания по русскому языку отечественным чиновникам и политикам всех уровней и ветвей власти. За диктантом «по Льву Толстому» последовали выступления известных языковедов и деятелей культуры о русском языке как родном, как языке межнационального общения и как одном из мировых языков.
...За последние несколько недель прошла волна мероприятий...
...Однако на самом деле широкую общественность и филологическое...
21 февраля в мире отмечается Международный день родного языка. Его задача — напомнить о ценности всех тех языков, которые достались нам в наследство. Когда родной язык народа уходит из общественной жизни, ему грозит превращение в набор отдельных слов и обрывочных рассказов, интересующих лишь исследователей. Эта угроза существует и для языков некоторых коренных народов России. Но современные технологии дают таким языкам надежду.
...21 февраля в мире отмечается Международный день родного...
...Родные языки в опасности Языки выходят из употребления...
Техническая документация наверняка была еще во времена Промышленной революции: любой станок требует хотя бы краткой инструкции по работе с ним. Но в компьютерную эпоху разнообразие и обилие программ, систем и устройств, которые надо описывать, привело к созданию нового функционального стиля речи со своей лексикой и фразеологией. Как вырабатывался этот стиль и какими качествами должно обладать удачное техническое описание, Грамоте рассказал технический писатель, один из авторов соответствующего профессионального стандарта Михаил Острогорский.
...Техническая документация наверняка была еще во времена...
...Придумать жанр Когда я только начинал заниматься технической...
Давно уже замечено, что порой слово, заимствованное из того или иного языка, со временем меняет свое произношение и написание. Процесс этот вполне закономерен и обусловлен освоением заимствования, подчинением его нормам русского языка, в том числе нормам орфоэпическим и орфографическим.
...Давно уже замечено, что порой слово, заимствованное...
...Так, например, слово офис, заимствованное русским языком...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Чтобы понять, как люди пользуются языком, лингвисты не только наблюдают. В этой науке тоже есть место эксперименту. О том, какой путь проделала экспериментальная лингвистика и какие есть современные способы организовать и провести эксперимент, рассказывает статья в журнале «Системный Блокъ».
...Чтобы понять, как люди пользуются языком, лингвисты...
...Когда-то лингвисты-теоретики основывали свои суждения...