Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В 2025 году отмечается 130-летие со дня рождения Виктора Владимировича Виноградова — выдающегося филолога, чье имя носит Институт русского языка Российской академии наук. О вкладе Виктора Виноградова в отечественную науку ведущая телепередачи Фекла Толстая поговорила с лингвистами Игорем Исаевым, Антоном Соминым, Натальей Козел и Анной Пестовой.
...В 2025 году отмечается 130-летие со дня рождения...
...Отец Феклы Толстой академик Никита Ильич Толстой около...
Российский союз промышленников и предпринимателей провел в сентябре опрос о кадровой ситуации в компаниях — членах союза. В опросе приняли участие почти двести организаций, в основном крупные предприятия. Дефицит кадров наблюдается в настоящее время в 82,8% опрошенных компаний. Один из способов преодоления дефицита кадров — привлечение иностранных работников. В 24,8% организаций трудовые мигранты занимают до 10% ...
...Российский союз промышленников и предпринимателей...
Различные источники в Рунете называют 3 февраля Днем борьбы с ненормативной лексикой или Днем борьбы с употреблением нецензурных слов. Когда и с чьей подачи возникла традиция отмечать этот день, нам установить не удалось. Однако сама дата привлекает внимание журналистов, филологов, чиновников и представителей общественных организаций как повод поговорить о границах допустимого применительно к употреблению бранной и стилистически сниженной лексики. В пресс-конференции, которая состоится в ...
...Различные источники в Рунете называют 3 февраля Днем...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...
Сериал «Слово пацана», который активно обсуждают уже почти два месяца, заинтересовал нас не только словом «чушпан», которое даже называли в качестве кандидата на роль слова года. Насколько точно на экране передан сленг улицы в целом? Грамота поговорила об этом Шамилем Идиатуллиным, который в 1980-е годы жил в городе Брежнев (ныне Набережные Челны) и написал об этом времени книгу.
...Сериал «Слово пацана», который активно...
...В «Слове пацана» есть хорошая фактическая...
Изначально этот текст, написанный лет десять назад и называвшийся «Заметки графофила», имел ограниченное хождение среди моих друзей и знакомых. Позднее бóльшая его часть под заголовком «„И пучину взворотила и поставила вверх дном“? (заметки об авторской пунктуации)» была опубликована в газете «Русский язык» (№ 7 за 2002 год). Сокращения коснулись отступления про «авторскую орфографию», а также материалов, найденных в интернете. Авторская орфография заслуживает отдельного обстоятельного разбора, текстов из интернета я и сейчас тоже почти не касаюсь.
...Изначально этот текст, написанный лет десять назад...
...За прошедшие десять лет интернет вырос многократно,...
Зародившись в игровых чатах поколения альфа как своеобразный «коммуникативный тик», то есть непроизвольная реакция на любой раздражитель, числовое выражение «6–7» (six-seven) распространилось по разным уголкам интернета. Недавно портал Dictionary.com признал его словом года. При этом у «6–7» нет определенного лексического значения: за ним не стоит никакая часть физического мира. Тогда зачем оно нужно?
...Зародившись в игровых чатах поколения альфа как своеобразный...
...Две небольшие разницы Смех, который следует за появлением...
Главный город акции был выбран на конференции Тотального диктанта (ТД), прошедшей с 29 января по 2 февраля в Санкт-Петербурге. За право называться столицей с Сириусом соревновались Омск, Ростов-на-Дону и Чита. Сириус имеет статус федеральной территории в составе Краснодарского края с декабря 2020 года. До этого он был частью Адлерского района города Сочи. На территории нынешнего Сириуса проходили соревнования зимних Олимпийских игр 2014
...Главный город акции был выбран на конференции Тотального...
Те варианты генов, которые связаны с плохим чувством ритма, также связаны с повышенной вероятностью дислексии (нарушения способности к чтению). Обратная зависимость также существует: гены, ассоциированные с хорошим чувством ритма, связаны также с языковыми способностями. Об этом говорят результаты исследования, опубликованного в журнале Nature Human Behaviour. Авторы работы обратились к данным более миллиона человек, которые были собраны компанией ...
...Те варианты генов, которые связаны с плохим чувством...