Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Изначально этот текст, написанный лет десять назад и называвшийся «Заметки графофила», имел ограниченное хождение среди моих друзей и знакомых. Позднее бóльшая его часть под заголовком «„И пучину взворотила и поставила вверх дном“? (заметки об авторской пунктуации)» была опубликована в газете «Русский язык» (№ 7 за 2002 год). Сокращения коснулись отступления про «авторскую орфографию», а также материалов, найденных в интернете. Авторская орфография заслуживает отдельного обстоятельного разбора, текстов из интернета я и сейчас тоже почти не касаюсь.
...Изначально этот текст, написанный лет десять назад...
...За прошедшие десять лет интернет вырос многократно,...
Для эффективной коммуникации важно уметь распознавать тонкие нюансы смысла, выраженные словами. Как выясняется, у мозга есть алгоритм для случаев, когда смысл сообщения неочевиден. Это выяснила международная команда с участием специалистов в области нейронаук из НИУ ВШЭ. Исследователи смоделировали эксперимент, в котором участникам нужно было определить, что имеет в виду говорящий. На экране появлялись четыре характеристики и три монстра —
...Для эффективной коммуникации важно уметь распознавать...
У носителей русского языка, в том числе и у пользователей Грамоты, часто возникают сложности с написанием слов на -овка и -ёвка: речовка, но ночёвка; плащовка, но размежёвка; мелочовка, но дешёвка. Какое правило тут действует? В более старых словарях речёвка, плащёвка и мелочёвка пишутся через ё, а сегодняшняя норма допускает только о. Проследим короткую, но бурную историю этих слов.
...У носителей русского языка, в том числе и у пользователей...
...Когда появились речовки? Слово речовка впервые фиксируется...
В силу различных исторических процессов — войн, революций, тормозивших развитие гражданского общества, — многие подданные Российского государства, в числе которых было немало нерусских по национальности, вынуждены были покинуть отечество, унося с собой знания родного русского языка и любовь к богатой культуре. Филолог и системный аналитик из Израиля предлагают свою программу сохранения русского языка и культуры для тех, кто уехал из России.
...В силу различных исторических процессов &...
...В местах нового проживания дети и тем более...
В жизни нам приходится запоминать огромное количество информации, особенно в связи с учебой. Простая зубрежка не просто отнимает много сил и времени, но и зачастую неэффективна. На помощь приходят мнемонические приемы, которые значительно упрощают процесс запоминания. В русском языке немало непростых правил, которые хорошо иллюстрируют мнемонические фразы. Мы постарались собрать самые известные приемы, чтобы «разложить по полочкам» спряжения, падежи, ударения и многое другое.
...В жизни нам приходится запоминать огромное количество...
...Как работает мнемоника Мнемоника (от др.-греч. &mu...
Полчаса на редактуру мало, редактирование — медленный процесс. Но скорость жизни в последнее десятилетие повысилась, а количество текстов увеличилось. Типичный редакторский кошмар: «У меня всего полчаса на этот текст». Наш чек-лист поможет сосредоточиться, когда приближается дедлайн, а вы не знаете, за что хвататься.
...Полчаса на редактуру мало, редактирование &mdash...
...Максимум возможного за минимум времени Развитие цифровых...
Лаборатория этнолингвистики, которая будет заниматься изучением и сохранением языков коренных малочисленных народов Камчатки, образована в составе Камчатского государственного университета им. Витуса Беринга. Вуз стал победителем в конкурсе Минобрнауки РФ на создание молодежных лабораторий. По словам и. о. ректора вуза Ольги Ребковец, среди приоритетных задач лаборатории — анализ языковой ситуации, сбор и оцифровка языкового ...
...Лаборатория этнолингвистики, которая будет заниматься...
За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».
...За двадцать лет Национальный корпус русского языка...
...Первые корпусы появились в 1960-х годах, но тогда...
Всего на конкурс было подано 239 работ из 21 страны мира, в том числе из стран ближнего зарубежья, а также Вьетнама, Индии, Венгрии, Китая, Кубы и Колумбии. «Главный критерий, по которому мы отбираем лауреатов, — их работа не должна быть методической разработкой, какие учителя обычно пишут к урокам, — объясняет председатель жюри конкурса, профессор НИУ ВШЭ Марина Королева. — Она должна быть живой, без общих слов, за ней ...
...Всего на конкурс было подано 239 работ из 21 ...