Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В русском языке Тмутаракань обозначает безнадежное захолустье вдали от столиц и вообще от цивилизации. Однако изначально это имя носил древний город с богатой историей, о которой рассказывает журнал «Наука и жизнь».
...В русском языке Тмутаракань обозначает безнадежное...
...Город Тмутаракань существовал еще в древние времена...
Сага «Звездные войны» давно стала культурным феноменом. При этом использование имен и понятий, присущих именно этой киновселенной, распространилось далеко за пределы фанатского сообщества. Сотрудница Хемницкого технического университета Кристина Санчес-Стокхаммер проверила, как терминология «Звездных войн» повлияла на современный английский язык. Ее интересовала частота появления выбранных ею слов в четырех разных корпусах английского языка, в том числе в Британском ...
...Сага «Звездные войны» давно стала культурным...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
За последние 30 лет эмодзи (смайлы) стали универсальным феноменом. К 2015 году, согласно исследованиям, 92% людей использовали их в онлайн-общении. Одна из причин популярности эмодзи в том, что они могут быть понятны каждому — по крайней мере базовые символы, обозначающие радость, грусть или гнев. Но даже их люди могут интепретировать по-разному, как выяснили авторы статьи в журнале PLOS ONE. К исследованию привлекли 253 добровольцев из ...
...За последние 30 лет эмодзи (смайлы) стали универсальным...
У этого слова есть несколько вариантов написания и один полный синоним: красный флаг. Калькированный вариант кажется более прозрачным, но слишком похож на красные знамена прошлого и хуже передает новый терминологический смысл. В чем он заключается?
...У этого слова есть несколько вариантов написания и...
...Что это значит В большинстве употреблений ред-флаг...
Формы организации текстового материала в Интернете весьма разнообразны. Не претендуя на формирование понятий, связанных с Интернетом, попробуем разобраться в семантике тех слов, которые, используя Интернет, мы уже часто употребляем, хотя они еще не получили своего места в лексической системе русского языка.
...Формы организации текстового материала в Интернете...
...Условно виртуальные тексты по способу образования и...
В эту подборку вошли в основном разного рода словари и энциклопедии для средней и старшей школы, изданные в последние 20 лет, и несколько книг для детей младшего школьного возраста, только начинающих задумываться об устройстве языка, на котором они говорят.
...В эту подборку вошли в основном разного рода словари...
...Книги о лингвистике могут помочь в освоении школьной...
Книга американского археолога и антрополога Дэвида Энтони «Лошадь, колесо и язык» была опубликована в 2007 году, но в переводе на русский язык появилась недавно. Автор рассказывает, кем были праиндоевропейцы, как они трансформировали цивилизацию и распространили свой язык на огромную территорию.
...Книга американского археолога и антрополога Дэвида...
...Примерно половина населения Земли разговаривает на...
Рабочая группа, в которую вошли сотрудники Института узбекского языка, литературы и фольклора Академии наук Узбекистана, составила список из 30 новых терминов, призванных заменить популярные слова, заимствованные из других языков. Об этом сообщает издание «Газета.uz» со ссылкой на Академию наук. Представители рабочей группы также призвали жителей страны участвовать в дискуссии о заимствованиях и предлагать свои варианты. В список нежелательных заимствований попали ...
...Рабочая группа, в которую вошли сотрудники Института...