Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.
...Сервисы обновленной Грамоты становятся более технологичными...
...Грамота: Что изменится для пользователей в результате...
Русский язык стал таким, каким мы его знаем сегодня, не сразу. Он прошел долгий путь, впитывая в себя конструкции церковного языка, народные говоры и иностранные заимствования. Правила грамотной речи тоже не появились сами собой. И здесь велика роль ученых, которые формировали представление о языковой норме. Одним из первых таких систематизаторов был Мелетий Смотрицкий.
...Русский язык стал таким, каким мы его знаем сегодня...
...Интеллектуал Нового времени Максим Герасимович Смотрицкий...
Существование и функционирование русского языка в российском сегменте интернета, безусловно, и заслуживает, и требует особого внимания. Хотя эта тема является во всех отношениях новой, неизученной, однако уже сейчас становится понятно, что в ближайшие годы она займет существенное место в языковедческих исследованиях.
...Существование и функционирование русского языка в российском...
...Прежде всего, необходимо определиться с терминологией...
Хорошую речь во всех функциональных стилях, безусловно, могут продуцировать носители элитарной речевой культуры, поскольку они обладают истинным мастерством владения языком, всем его богатством при соблюдении всех правил и ограничений. К сожалению, чаще мы наблюдаем речь не носителей элитарной речевой культуры, а речь носителей среднелитературной речевой культуры, к которой принадлежит большинство лиц с высшим (даже специальным филологическим) образованием.
...Хорошую речь во всех функциональных стилях, безусловно...
...Среднелитературная речевая культура, напомним, отличается...
Люди давно поняли, что записывать слова от руки — слишком трудоемкий процесс. Чтобы быстро делиться большими объемами информации, нужно было этот процесс упростить и ускорить. И вот примерно полтора века назад решение было найдено. С тех пор человечество стучит по клавишам.
...Люди давно поняли, что записывать слова от руки &mdash...
...«Ремингтон» и скорописец Английский инженер...
Когда мы видим огромного толстокожего черного зверя с четырьмя зубами — в голове сразу всплывает слово «бегемот». А вот у какого-нибудь европейца это слово вызовет ассоциации с Книгой Иова (а то и с музыкальной группой, играющей тяжелую музыку). Этимология названий экзотических животных полна детективных историй, где логика перемежается с мистификациями, ошибками и легендами.
...Когда мы видим огромного толстокожего черного зверя...
...Этот материал — часть совместного проекта...
Оценка языковой доступности учебных текстов для школьников сегодня не опирается на четкие критерии и прозрачную методологию. Так быть не должно, считает Антонина Лапошина — кандидат педагогических наук, специалист по компьютерной лингвистике из Института Пушкина. Она рассказала Грамоте о том, какие методы оценки текста есть в распоряжении экспертов и чем они могут быть полезны и школьникам, и авторам учебников.
...Оценка языковой доступности учебных текстов для школьников...
...Грамота: Какие проблемы должна решать лингвистическая...
Проблемы, которые мы здесь обсуждаем, в конечном итоге сводятся к оценке состояния русского языка, и зеркалом этого состояния является язык средств массовой информации. Само слово «состояние» заряжено негативной оценкой, предполагает какие-то дефекты в предмете. Ср. «состояние больного внушает опасения», «состояние конструкции здания чревато опасностями» и т. п. Но когда мы говорим о состоянии языка, мы разве озабочены разрушением его морфологического строя? Или нас настораживают изменения в его фонетике, в его синтаксисе?
...Проблемы, которые мы здесь обсуждаем, в конечном итоге...
...Нет, структурная его организация вполне благополучна...
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Что такое Национальный словарный фонд: концепция и...