Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Если повторить одно и то же слово много раз, в какой-то момент оно покажется бессмысленным набором звуков. Многие проверяли на себе это забавное явление хотя бы раз в жизни. Но, как выяснилось, им интересуются и исследователи. Авторы статьи, опубликованной в журнале Memory, провели эксперимент с целью понять, легко ли вызвать это ощущение целенаправленно. В ходе эксперимента 94 студента должны были много раз подряд записывать одно и то же слово. Они проделывали это с 12 словами (например, со ...
...Если повторить одно и то же слово много раз, в какой-то...
Отчего безропотное принятие смерти от рук убийц, подосланных нечестивцем, который захватил киевский престол, стало причиной канонизации братьев и прославило их в веках? Что такое «удвоенная» святость и греховная «двойственность»? И почему настоящим прародителем Святополка, рожденного, согласно автору жития, от двух отцов, на самом деле был третий отец — дьявол? «Горький» продолжает публикацию статей Андрея Ранчина из цикла «Как читать древнерусскую литературу».
...Отчего безропотное принятие смерти от рук убийц, подосланных...
...Князья-братья Борис и Глеб — одни из самых почитаемых...
В новом номере журнала среди прочих тем обсуждаются отглагольные существительные в русских говорах, язык личных писем первой жены Петра I Евдокии Лопухиной и правила пунктуационного оформления определительных оборотов в препозиции.
...В новом номере журнала среди прочих тем обсуждаются...
...Диалектные слова для взяточников и взяткодателей...
Национальная премия «Страну меняют люди» была учреждена по поручению президента Владимира Путина. Ее цель — отметить вклад в развитие страны предпринимателей, ученых, инженеров, которые разрабатывают и внедряют передовые решения. Организаторы — Агентство стратегических инициатив, Фонд Росконгресс, ВЭБ. РФ, Министерство обороны, Министерство культуры и Фонд «Защитники Отечества», АНО «Россия — страна ...
...Национальная премия «Страну меняют люди»...
В Год семьи Российский книжный союз совместно с Русской школьной библиотечной ассоциацией запустил проект «Читающая мама», направленный на популяризацию традиций семейного чтения. Родителей призывают уделять этому занятию хотя бы десять минут в день. Авторы перечисляют те задачи, которые можно решить благодаря регулярному чтению детям; в их числе — развитие речи, развитие навыков чтения и воображения, формирование эмоционального ...
...В Год семьи Российский книжный союз совместно с ...
В сентябре пользователи интересовались среди прочего расстановкой запятых при выражении «в том числе» и проблемами оформления списков литературы по ГОСТу.
...В сентябре пользователи интересовались среди прочего...
...Лексика Вопрос: Понятие «инаугурация»...
Нивхский — один из малых языков России, на котором почти перестали разговаривать его носители. О том, как нейросети и голосовые помощники помогают сохранить нивхский, а в перспективе могут улучшить ситуацию и с другими языками малочисленных народов, в интервью изданию «Научная Россия» рассказал руководитель лаборатории, доктор филологических наук Павел Гращенков.
...Нивхский — один из малых языков России,...
...Павел Гращенков руководит Лабораторией автоматизированных...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Русская топонимика может показаться запутанной и нелогичной из-за многообразия вариантов написания. Например, почему Переславль-Залесский пишется через дефис, а Ростов Великий — раздельно? Разбираем сложные орфографические случаи и объясняем, с чем может быть связана разница.
...Русская топонимика может показаться запутанной и нелогичной...
...Раздельное написание топонимов Географические названия...