Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Стало понятно, что если человек ищет что-то, связанное со строительными принадлежностями, это не значит, что ему нужно показывать в выдаче только молотки. Может быть, ему нужны еще и гвозди....
... К сожалению, не с каждым писателем можно «разобраться» с помощью векторов: они, как и любая технология, основанная на статистике, дают значимые результаты только при достаточном объеме данных....
...По сути дела, это тоже информационный поиск, только примененный к одной коллекции текстов. Многозначность как преимущество При векторном описании все значения многозначного слова слипаются в один комок: для каких-то задач это проблема, а для каких-то, наоборот, решение....
Появление интернета как общедоступного пространства общения породило новое языковое разделение. Язык блогов, форумов и соцсетей, не скованный литературными и типографскими нормами, теперь существует параллельно с языком традиционных СМИ. Но граница между ними проницаема: медиа и сами живут на территории интернета, а «зумерский» сленг и новые понятия легко проникают в серьезные газеты и журналы.
...Появление интернета как общедоступного пространства...
...Хайп, кринж и краш на всю страну: зачем медиа используют...
...В блогах и соцсетях нет такой задачи — главное, чтобы тебя поняли (или даже чтобы поняли только те, кто «в теме»). «Смартфонный диалект»....
...Иногда новые понятия знакомы не только молодым, но и более взрослой аудитории, но старшие поколения нуждаются в дополнительной информации. Можно привести в пример статью «Тролли и хейтеры....
...Имена для явлений Молодые поколения не только говорят о привычных вещах по-своему, но и дают названия новым трендам, стилям, занятиям и явлениям. А СМИ, в свою очередь, анализируют эти новые понятия, показывая другим поколениям, как меняется мир....
Врожденная грамотность существует или это миф? Как она проявляется и чем ее можно объяснить? Грамота опросила в соцсетях около 40 человек, которые с детства писали без ошибок. Результаты этого мини-исследования мы обсудили со Светланой Викторовной Друговейко-Должанской — старшим научным сотрудником Института русского языка им. В. В. Виноградова РАН, членом Филологического совета Тотального диктанта и Орфографической комиссии РАН.
...Врожденная грамотность существует или это миф? Как...
...Миф о врожденной грамотности и правда о тех, кто пишет...
...Она говорит о врожденной грамотности со знанием дела: не только как филолог, но и как человек, который сам обладает этой мифической способностью....
...Она сделала в нем только одну ошибку — в слове винегрет. Точно такую же историю «с винегретом» рассказала нам и Светлана Друговейко-Должанская....
...Многим участникам нашего опроса было сложно запоминать правила, а фонетический разбор и вовсе превращался в пытку: приходилось не только видеть, но и записывать «неправильные» слова....
Даже грамотные носители русского языка сталкиваются с трудностями, когда им нужно написать редкое, длинное, заимствованное или просто незнакомое слово. Да, в современные устройства встроена автоматическая проверка орфографии, но она не всегда работает корректно и не помогает, когда мы (такое тоже бывает!) пишем важный текст от руки. В случае сомнений всегда лучше свериться со словарем — желательно с самым новым.
...Даже грамотные носители русского языка сталкиваются...
...Орфографические словари: как не ошибиться в написании...
... Орфографический словарь сообщает нам правильное написание слова, но не объясняет, почему кодификаторы приняли такое решение, — эту функцию берут на себя справочники, в которых обычно описывается не только орфография, но и пунктуация....
...Он содержит более двухсот тысяч единиц русского языка, включая не только слова, но и первые части слов, неоднословные нарицательные единицы и имена собственные. Преимущество этого ресурса в том, что он постоянно обновляется и пополняется новой лексикой....
...варианты фонемы, обусловленные фонетическим окружением) и передаваться одной графемой, а в других языках для каждого из этих звуков будет своя графема: например, в русском твердый звук [н] и мягкий [н’] обозначают одной буквой н (ь как показатель мягкости пишется только...
Нередко книжный язык воспринимают как эталонный, а к разговорному относятся пренебрежительно. Есть ли тут иерархические отношения? В чем особенности разговорной речи, как она соотносится с литературной нормой и с просторечием? Почему ее интересно изучать лингвистам? Мы спросили об этом кандидата филологических наук, ведущего научного сотрудника Института русского языка им. В. В. Виноградова РАН и одного из авторов-составителей «Толкового словаря русской разговорной речи» Анну Владимировну Занадворову.
...Нередко книжный язык воспринимают как эталонный, а&...
...Русская разговорная речь: как мы общаемся в обычной...
...Разговорная речь бывает только устной или может быть письменной? Разговорный язык — часть литературного или «ниже» его? Какие нормы действуют в разговорной речи? Бывает ли так, что мы говорим не на разговорном языке, а на каком-то другом?...
... подразумевает, что слово соответствует литературной норме, но только в рамках разговорной речи — в противоположность книжной, или строгой, норме. Однако провести четкую границу между просторечным и разговорным словом бывает затруднительно....
... Лексические особенности разговорной речи состоят, в частности, в том, что в ней могут употребляться не только нейтральные (внестилевые) и разговорные слова, но и в какой-то степени жаргонизмы (разборки, бабло), профессионализмы (безлимит ‘безлимитный тариф’, генералка ‘...
...Анна Занадворова дает такие примеры: «Они употребляются только в непринужденном письменном общении, но не в устной речи: например, ИМХО (сокращение от английского in my humble opinion ‘по моему скромному мнению’), его русский аналог кмк (‘как мне кажется’) или ЗЫ вместо...
Сегодня специалисты согласны в том, что сложные системы коммуникации есть не только у людей. Понимание того, как общаются животные, может дать представление об их социальных структурах и поведении и улучшить жизнь одомашненных видов. Прогресс в этом направлении обеспечивают нейросети, которые анализируют большие объемы информации и находят неочевидные закономерности. Исследователи из канадского Университета Далхаузи использовали методы обработки естественного языка ...
...Искусственный интеллект научился частично понимать...
...Сегодня специалисты согласны в том, что сложные системы коммуникации есть не только у людей. Понимание того, как общаются животные, может дать представление об их социальных структурах и поведении и улучшить жизнь одомашненных видов....
Благодаря социальным сетям и другим цифровым инструментам коммуникации новые слова сегодня входят в язык быстрее, чем когда-либо. И, как выясняется, активнее всего в этом процессе участвуют молодые женщины. Социолингвист Уильям Лабов долгое время исследовал языковые различия между мужчинами и женщинами и пришел к выводу, что женщины ответственны за 90% языковых изменений, — будь то новые слова, распространение новых речевых формул или изменение ...
...Молодые женщины вносят главный вклад в распространение...
...Эта особенность касается не только современности. В 1996 году команда лингвистов проанализировала 6000 писем, написанных с 1410 по 1680 год....
Лингвисты из Института языкознания РАН выявили в материалах переписи населения 2021 года несколько языков, на которых больше не говорят. Анализируя ответы респондентов на вопрос, какими языками они владеют, специалисты обнаружили пять языков, которые отнесены к исчезнувшим (алеутский, керекский, айнский, сиреникский и югский), а также один, отнесенный к заснувшим (орочский). Общее между двумя категориями в том, что этими языками никто полноценно не владеет.
...Лингвисты обнаружили в данных переписи населения пять...
...В любом случае перепись не может дать абсолютно точной картины состояния языков, поскольку фиксирует только самоотчеты людей; реальный уровень, на котором они владеют языком, никто не проверяет....
Слова пожалуйста и спасибо считаются универсальными составляющими вежливого общения. Мы привыкли думать, что эти слова следует употреблять независимо от обстоятельств, просто потому, что так принято. Но исследователи из Калифорнийского университета в Лос-Анджелесе выяснили, что в практике употребления слова пожалуйста гораздо больше нюансов, чем может показаться на первый взгляд. Авторы работы, опубликованной в журнале Social Psychology Quarterly, записали на видео ...
...Исследование: вежливое «пожалуйста» используется в...
...Исследователей удивило, что только в 7% случаев (69 из примерно тысячи ситуаций) люди сопровождали просьбу словом пожалуйста (англ. please)....
В книжных магазинах Amazon появились англоязычные книги о сборе и приготовлении грибов, созданные с помощью генеративных нейросетей. Эти книги часто не опираются на научные данные и могут содержать неточную или даже опасную информацию. На это обратило внимание онлайн-издание 404 Media, посвященное технологиям и связанным с ними этическим проблемам. О проблеме с книгами, сгенерированными искусственным интеллектом, журналисты пишут уже больше года. Многие из ...
...В онлайн-продаже обнаружены книги о сборе грибов, сгенерированные...
...Пожалуйста, покупайте только книги известных авторов и собирателей, это может быть буквально вопросом жизни и смерти». Автор 404 Media проанализировал две книги о грибах некоего Эдварда Дж....