Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Например, это может быть корпус законов или корпус...
Как в точности соотносятся церковнославянский, старославянский и древнерусский языки? На это вопрос даже многие выпускники филологических факультетов не могут дать внятный ответ. При этом если древнерусский и старославянский остались в далеком прошлом, церковнославянский жив и сегодня, хотя и для ограниченного круга людей. Как сложилась его судьба и чем он интересен с лингвистической точки зрения? Об этом Грамота поговорила с ведущим научным сотрудником Института русского языка им. В. В. Виноградова РАН, руководителем научного центра по изучению церковнославянского языка и проекта создания Большого словаря церковнославянского языка Нового времени Александром Геннадьевичем Кравецким.
...Как в точности соотносятся церковнославянский, старославянский...
...Корпус книг, по которым православные славяне совершали...
...благодаря компьютерным технологиям можно было бы взять корпус...
В последние годы в России идет интенсивный поиск национальной идеи. Количество предлагаемых вариантов огромно — от «вливания» в Европу и евразийства до пития водки или пива. При всем обилии идей ни одна не становится пока доминирующей. В чем здесь дело?
...В последние годы в России идет интенсивный поиск национальной...
...Вернее, корпус текстов (Конституция, гимн и др.)....
Образовательная платформа «ПостНаука» опубликовала компиляцию видеороликов, которые посвящены языкам и их изучению. Лингвисты Владимир Плунгян, Александр Пиперски и Кирилл Бабаев рассказали о лексических и фонетических особенностях разных языков, о том, есть ли среди них объективно сложные, как изучение мертвых языков помогло развитию корпусной лингвистики и как ученые продолжают открывать всё новые языки.
...Образовательная платформа «ПостНаука» опубликовала...
...хороший филолог-классик имеет в голове целый корпус...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
... Corpus latino-rossicum Это параллельный корпус...
Один из проектов обновленной Грамоты — Лексикон. В него попадают новые слова, которые уже вызывают живой интерес у наших пользователей (и не только), но еще не фиксируются академическими словарями. Как выбирать и описывать такие слова — вопрос, который сегодня актуален для портала. Эксперты и сотрудники Грамоты постарались ответить на него в режиме живой дискуссии. Предлагаем вам познакомиться с высказанными идеями.
...Один из проектов обновленной Грамоты — Лексикон...
...Корпус текстов художественной литературы, безусловно...
...собранному корпусу, и тут сложность в том, что корпус...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Словаря языка Толстого», также будет подготовлен корпус...
Пресс-конференция с участием разработчиков нормативных словарей русского языка как государственного языка РФ прошла 21 мая в пресс-центре «Россия сегодня». Министр просвещения Сергей Кравцов начал разговор с того, что появление словарей русского языка как государственного языка РФ важно и для юридической практики, и для системы образования, и для средств массовой информации. Его поддержал ректор Санкт-Петербургского государственного университета, доктор юридических ...
...очень большой (этим он отличается от других аналогов) корпус...
Имба — не самое известное слово, пришедшее из языка геймеров, но переосмысленное как выражение положительной оценки. Оно входит в число популярных молодежных неологизмов уже не первый год.
...Имба — не самое известное слово, пришедшее...
...К примеру, корпус «Центральные СМИ»...
В День русского языка филологи, педагоги, общественные деятели традиционно обсуждают вопросы, связанные с актуальным состоянием языка, тенденциями его развития, возможностями его государственной поддержки и защиты. В круглом столе «Государственная языковая политика: от среднего образования до сохранения редких языков и диалектов русского языка», который состоялся 6 июня в пресс-центре «Россия сегодня», принимали участие член Совета по ...
...Другой полезный ресурс — Национальный корпус...