Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Слово и его окружение Идея представления слова...
Ведущий канала «Основа» Борис Веденский обсудил с историком-медиевистом, переводчиком, доктором исторических наук Олегом Воскобойниковым отличия письменной культуры Руси от стран Западной Европы, процесс переписывания рукописей и издание древних текстов, а также выяснил, что пили в Средние века и были ли на Руси ведьмы.
...Ведущий канала «Основа» Борис Веденский...
...О чем мы можем узнать из средневековых рукописных текстов...
...Монгольское нашествие сильно ударило по всем сторонам...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Произведения из школьной программы и развитие нейросетевой...
...Национальный корпус русского языка — это огромная...
Разные словари необходимы для разных задач. Какими-то пользуются только специалисты, другие нужны тем, кто так или иначе работают с языком, — учителям, школьникам, студентам, редакторам, публицистам. Расскажем о пяти самых востребованных типах словарей для широкого круга пользователей: толковом, орфографическом, словаре ударений, двуязычном и словаре синонимов.
...Разные словари необходимы для разных задач. Какими-то...
...Пять видов словарей на каждый день...
...Изначально словари были рукописными, малого объема...
Ученый совет Института русского языка РАН утвердил к печати 30-й том «Этимологического словаря славянских языков» под редакцией академика О. Н. Трубачева, который реконструирует праславянский лексический фонд.
...Ученый совет Института русского языка РАН утвердил...
...Утвержден к печати 30-й том «Этимологического словаря...
...Словарь, построенный на устных и письменных данных...
В русском языке глагол-сказуемое согласуется с подлежащим по лицу и числу в настоящем времени и по роду и числу в прошедшем. Когда подлежащее выражено одним словом — существительным или местоимением, с согласованием не возникает проблем. Но если подлежащее нетипичное, возможны разные варианты. Применить корпусные методы к таким конструкциям сложно, потому что в корпусе они почти не встречаются. Но можно изучать их методами экспериментального синтаксиса.
...В русском языке глагол-сказуемое согласуется с подлежащим...
...Выбор лица: как глагол согласуется с подлежащим типа...
...Три стратегии выбора Мы будем рассматривать случаи...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...В Москве прошла первая стратегическая сессия «Информационные...
...Александр Антонов, руководитель группы оценки качества...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...Удобный интерфейс для профессионалов и любителей: масштабное...
...В 2023 году проект «Национальный корпус русского...
Каждый год специалисты фиксируют, что происходит с языком: какие слова становятся популярными, как меняется норма, каким образом влияют на язык новые законодательные инициативы. Всю правду о том, как жилось русскому языку в уходящем году, раскроет научный руководитель Грамоты, а также председатель филологического совета Тотального диктанта, научный сотрудник Института русского языка им. В. В. Виноградова РАН и ведущий подкаста «Розенталь и Гильденстерн» Владимир Пахомов. Лекция ...
...19 декабря научный руководитель Грамоты Владимир Пахомов...
...Каждый год специалисты фиксируют, что происходит с...
Оценка языковой доступности учебных текстов для школьников сегодня не опирается на четкие критерии и прозрачную методологию. Так быть не должно, считает Антонина Лапошина — кандидат педагогических наук, специалист по компьютерной лингвистике из Института Пушкина. Она рассказала Грамоте о том, какие методы оценки текста есть в распоряжении экспертов и чем они могут быть полезны и школьникам, и авторам учебников.
...Оценка языковой доступности учебных текстов для школьников...
...Как лингвистическая экспертиза может повысить качество...
...Грамота: Какие проблемы должна решать лингвистическая...