Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Начиная с 1990-х годов русский язык постепенно утрачивал свои позиции в мире. Сегодня его продвижение вновь стало государственным приоритетом. О том, как в разных странах исторически складывались симпатии к русскому языку, в каком положении он находится сейчас и как будет развиваться ситуация в ближайшие годы — в обзорной статье Грамоты.
...Начиная с 1990-х годов русский язык постепенно утрачивал...
...Родная речь от Белграда до Харбина Русский язык остается...
Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.
...Сервисы обновленной Грамоты становятся более технологичными...
...Грамота: Что изменится для пользователей в результате...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Техническая документация наверняка была еще во времена Промышленной революции: любой станок требует хотя бы краткой инструкции по работе с ним. Но в компьютерную эпоху разнообразие и обилие программ, систем и устройств, которые надо описывать, привело к созданию нового функционального стиля речи со своей лексикой и фразеологией. Как вырабатывался этот стиль и какими качествами должно обладать удачное техническое описание, Грамоте рассказал технический писатель, один из авторов соответствующего профессионального стандарта Михаил Острогорский.
...Техническая документация наверняка была еще во времена...
...Придумать жанр Когда я только начинал заниматься технической...
Язык всё время меняется, и за 25 лет в нем изменилось многое: звучание слов, произношение звуков, интонация. Появились новые словообразовательные модели, некоторые новые синтаксические конструкции стали уже совершенно привычными. К примеру, раньше конструкция можно, пожалуйста... была абсолютно недопустима, а теперь молодежь даже не понимает, в чем здесь проблема.
...Язык всё время меняется, и за 25 лет в нем изменилось...
...Грамота уже 25 лет наблюдает за жизнью русского языка...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Фразеология часто оказывается самой непонятной частью языка не только для иностранцев, но и для младших поколений, которые редко встречали и никогда не употребляли выражения вроде «семь пятниц на неделе». Многие идиомы кажутся устаревшими и ассоциируются с речью бабушек и дедушек. Но никогда не поздно разобраться, какой смысл имеют истории про белок, комаров, баранов и молочные реки, даже если вы сами использовать эти выражения не собираетесь. Мы выбрали семь идиом, которые чаще других ищут на Грамоте — и не находят! Самое время дополнить Справочник по фразеологии.
...Фразеология часто оказывается самой непонятной частью...
...Крутиться как белка в колесе Образ. Белка, которая...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Как и люди, системы искусственного интеллекта...
Известный факт: мы больше доверяем людям, похожим на нас. Это верно и по отношению к тем людям, чья речь похожа на нашу: выбором слов, грамматических конструкций, произношением. Но какие механизмы социальной психологии стоят за этим? Ответить на эти вопросы помогла недавняя работа междисциплинарной исследовательской группы под руководством Терезы Матцингер из Венского университета. Группа рассматривала две версии. Согласно первой, люди доверяют тем, кого интуитивно ...
...Известный факт: мы больше доверяем людям, похожим на...