Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Нам трудно себе это представить, но зимние праздники еще двести лет назад выглядели совсем не так, как сегодня. И не только потому, что главным было Рождество, но и потому, что никаких новогодних и рождественских елок во времена Пушкина еще не было. Мы решили разобраться, как появилось в России главное новогоднее слово и какими еще словами сопровождается встреча Нового года.
...Нам трудно себе это представить, но зимние праздники...
...Святки, Рождество, Новый год Впервые елку на рождественские...
Открывая словарь в поисках нужного слова, мы часто видим не только толкование или, например, сведения об ударении, но и помету, одну или несколько: разг., книж., сниж., спец., неодобрит., шутл. Какие бывают пометы, насколько они универсальны и как на них влияют языковая политика, общественные настроения и личные убеждения составителей словарей?
...Открывая словарь в поисках нужного слова, мы часто...
...Что такое помета Согласно одному из определений...
Термин «государственный язык» используется в законодательстве, но не имеет однозначного толкования. Что это такое и в чем его функция, каждый понимает по-своему. Ясно одно: «государственный» в этом случае — категория не лингвистическая, а правовая.
...Термин «государственный язык» используется...
...Юридическая история Под языковым законодательством...
Английский термин Tone of Voice (сокращенно ToV) обозначает ту интонацию, которую улавливает в тексте читатель. Этот термин пришел из маркетинга и сначала касался только бизнес-коммуникаций, голоса бренда. Затем он стал применяться к любым видам коммуникаций с аудиторией, в том числе и к тому, как государство говорит с гражданами. И, наконец, сблизился с тем, что понимается на школьных уроках литературы под «образом автора». Как устроен этот образ и что может сделать пишущий, чтобы тональность текста попала в цель?
...Английский термин Tone of Voice (сокращенно ToV) обозначает...
...Образ автора, неуловимый и вездесущий ToV описывает...
Появление интернета как общедоступного пространства общения породило новое языковое разделение. Язык блогов, форумов и соцсетей, не скованный литературными и типографскими нормами, теперь существует параллельно с языком традиционных СМИ. Но граница между ними проницаема: медиа и сами живут на территории интернета, а «зумерский» сленг и новые понятия легко проникают в серьезные газеты и журналы.
...Появление интернета как общедоступного пространства...
...Чем отличается язык молодежи Традиционные СМИ ориентируются...
Выбором «слова года» занимаются авторитетные словари, языковые институты, газеты и сайты. С недавнего времени такую акцию проводит и Грамота. Чем отличается наш подход к определению «слова года»? Как мы собираем данные, фильтруем и оцениваем их? Приоткрываем дверь на нашу социолингвистическую кухню. И предупреждаем: у большого «слова года» будет свита из «главных слов» в разных сферах.
...Выбором «слова года» занимаются авторитетные...
...Вторые «выборы»: развиваем методологию...
Как уже все, наверное, слышали, словом года по версии Грамоты стал «вайб», а в отдельных номинациях победили «промпт», «маркетплейс», «подкаст» и «микроРНК». Мы попросили наблюдателей и участников акции поделиться впечатлениями и подвести предварительные итоги.
...Как уже все, наверное, слышали, словом года по версии...
...Дмитрий Смиркин, директор по связям с общественностью...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Приятель брата — Митя или Дима? А новая коллега — Женя или Евгения? Анна Ивановна считает себя начальником или начальницей? Как описать соседа: он глухой или с нарушениями слуха? Во многих ситуациях нам приходится делать этот непростой выбор. На что лучше ориентироваться: на мнение того, о ком речь, на правила языка или на собственное удобство? Грамота расспросила об этом популяризатора лингвистики, кандидата филологических наук Александра Пиперски.
...Приятель брата — Митя или Дима? А новая...
...Выбор имени: родители, святцы и другие алгоритмы...