Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Большинство пользователей ищут слово на Грамоте, если они не уверены в его правописании, произношении или значении. Но иногда человек хочет найти слово или выражение, которое он просто недослышал или неправильно вычленил из потока речи. Мы проанализировали поисковые запросы уходящего года и выбрали 15 странных слов, которые нас удивили, порадовали или озадачили. Попробуем догадаться, как они пришли в голову спрашивающим и что на самом деле имелось в виду.
...Большинство пользователей ищут слово на Грамоте, если...
...Подобные вымышленные слова крайне интересны с точки...
Врожденная грамотность существует или это миф? Как она проявляется и чем ее можно объяснить? Грамота опросила в соцсетях около 40 человек, которые с детства писали без ошибок. Результаты этого мини-исследования мы обсудили со Светланой Викторовной Друговейко-Должанской — старшим научным сотрудником Института русского языка им. В. В. Виноградова РАН, членом Филологического совета Тотального диктанта и Орфографической комиссии РАН.
...Врожденная грамотность существует или это миф? Как...
...Почему грамотность не может быть врожденной Врожденная...
К языку средств массовой информации в последние годы читающей либо слушающей публикой и изучающими его специалистами-филологами предъявляются многочисленные и, увы, чаще всего вполне обоснованные претензии. Публику раздражает или шокирует, а специалистам кажется неоправданным или даже неприемлемым многое: и перенасыщение языка СМИ американизмами, и обилие в нем жаргонной, «блатной» и даже матерной лексики, и нарушение нормального темпа и нормативного интонационного рисунка речи.
...К языку средств массовой информации в последние годы...
...Кое-какие из этих претензий можно счесть, конечно,...
Искусственные языки изучают как лингвисты, так и энтузиасты, создающие целые интернациональные сообщества. Об интересных примерах конлангов рассказывает статья в журнале «Наука и жизнь».
...Искусственные языки изучают как лингвисты, так и энтузиасты...
...Хильдегарда Бингенская, жившая в Германии в XII веке...
Онлайн-журнал «Системный Блокъ» рассказал о масштабных нововведениях в НКРЯ: появились новые корпуса и новые функции.
...Онлайн-журнал «Системный Блокъ» рассказал...
...Национальный корпус русского языка (НКРЯ) — ключевой...
Workspace Digital Awards — престижная отраслевая премия в сфере digital. Ежегодно участие в ней принимают лучшие агентства, дизайн-студии и команды. В рамках конкурса оцениваются кейсы, поданные агентствами через личный кабинет Workspace. Победители определяются в три этапа посредством народного голосования и голосования жюри, в которое входят лидеры отрасли: представители известных брендов, арт-директора, владельцы компаний. Грамота соревновалась ...
...Workspace Digital Awards — престижная отраслевая...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Грамота: Все, кто работает с языком как исследователи...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Чтобы понять, как люди пользуются языком, лингвисты не только наблюдают. В этой науке тоже есть место эксперименту. О том, какой путь проделала экспериментальная лингвистика и какие есть современные способы организовать и провести эксперимент, рассказывает статья в журнале «Системный Блокъ».
...Чтобы понять, как люди пользуются языком, лингвисты...
...Когда-то лингвисты-теоретики основывали свои суждения...