Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Представьте себе словарь, в котором значения слов зависят от возраста читающего, его культурного бэкграунда, политических взглядов и даже формата книги. Именно так обстоят дела с эмодзи — универсальными и одновременно субъективными пиктограммами, которыми каждый день пользуются миллионы людей во всем мире.
...Представьте себе словарь, в котором значения слов зависят...
...Этот материал — часть совместного...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Я не думаю, что в последние не то что двадцать пять, а в последние сто лет русский язык сильно менялся. Я слышал язык разных поколений, застал еще свою деревенскую прабабушку, которая училась в церковно-приходской школе и поэтому была грамотной. Она говорила на том же языке, на котором говорю я, на котором говорят мои дети и, надеюсь, будут говорить мои внуки.
...Я не думаю, что в последние не то что двадцать пять...
...Другое дело, что в русский язык все время приходят...
Лингвист Максим Кронгауз дал два интервью: каналу «Основа» и каналу «Поговорим про РКИ (русский язык как иностранный)». Речь шла о том, почему приставки в русском языке более «живые», чем в романских, чем обращения в русском отличаются от других языков, как на естественный язык повлияет искусственный интеллект и чем интересен новояз из романа Джорджа Оруэлла «1984».
...Лингвист Максим Кронгауз дал два интервью: каналу &...
...1. Приставка в русском языке способна быть центром...
Всем, кто имеет отношение к организации Тотального диктанта, творчество Евы Даласкиной знакомо отлично. Еще в 2015 году кто-то из «диктаторов» произнес: «Сейчас мы напишем текст Е. Водолазкина», — а кто-то из «диктантеров» записал имя автора так: «Ева Даласкина». С тех пор все нелепицы, которые обнаруживают проверяющие в текстах диктанта, приписываются этой авторессе.
...Всем, кто имеет отношение к организации Тотального...
...Заслуженная популярность Ева Даласкина, будем честны...
Давно уже замечено, что порой слово, заимствованное из того или иного языка, со временем меняет свое произношение и написание. Процесс этот вполне закономерен и обусловлен освоением заимствования, подчинением его нормам русского языка, в том числе нормам орфоэпическим и орфографическим.
...Давно уже замечено, что порой слово, заимствованное...
...Так, например, слово офис, заимствованное русским языком...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Как и люди, системы искусственного интеллекта...
«Заметки на полях» — совместный проект Тотального диктанта и сервиса МТС «Строки». Научный руководитель Грамоты Владимир Пахомов ведет его вместе с писательницей Ириной Лейк. В первом выпуске ведущие обсудили интересные слова и выражения — как модные и современные, так и из лексикона Льва Толстого.
...«Заметки на полях» — совместный проект...
...Ведущие вспомнили школьные годы, когда они впервые...
Недавно принятая в России Концепция государственной языковой политики призывает к защите русского языка от иностранных заимствований. До этого, в феврале 2023 года, были приняты поправки в закон «О государственном языке РФ», которые ограничивают использование англицизмов в рекламе. Россия — не единственная страна, чье правительство обеспокоено защитой своего языка от иностранного влияния. Такую же политику проводит и канадская ...
...Недавно принятая в России Концепция государственной...