Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Слово и его окружение Идея представления слова...
Академик Виктор Владимирович Виноградов одним из первых разработал принципы филологического жанра «история слов». В его книге, которая так и называется «История слов», рассказано, как произошли те или иные слова, каково было их этимологическое значение, как изменялись значения и форма слов, как они использовались в классической литературе и в современных произведениях.
...Академик Виктор Владимирович Виноградов одним из первых...
...Пророк, урок, речь......
...Чрезвычайно интересно проследить историю слова речь...
Дать лингвистический комментарий проекта федерального закона о государственном языке — задача не из простых. Да, такой закон, безусловно, нужен. Но каковы его цели, в чем состоит, так сказать, его сверхзадача? Как должен быть сформулирован закон о языке, чтобы он не превратился в пустую бумажку или широковещательную и неконкретную декларацию? Вопросы, вопросы...
Доктор филологических наук Лев Скворцов анализирует текст проекта закона о государственном языке для «Литературной газеты».
...Дать лингвистический комментарий проекта федерального...
...Язык мой. Что родила гора?...
...О работе над этим законом я от своих коллег-филологов...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Роспатент выдал свидетельство о регистрации Национального...
...Об этом 15 сентября сообщил главный разработчик системы...
Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.
...Сервисы обновленной Грамоты становятся более технологичными...
...Как искусственный интеллект изменит возможности Грамоты...
...Грамота: Что изменится для пользователей в результате...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Произведения из школьной программы и развитие нейросетевой...
...Национальный корпус русского языка — это огромная...
Сегодня миллионы книг могут быть доступны нам в три клика. Нынешнее поколение школьников и студентов выросло с гаджетами в руках и с детства привыкло читать с экранов, что не могло не заинтересовать исследователей. Собранные данные говорят о том, что изменение носителя информации влияет на понимание и усвоение прочитанного. Вопрос в том, как именно влияет.
...Сегодня миллионы книг могут быть доступны нам в ...
...Бумага или «цифра»? Влияние формата чтения на понимание...
...Чтение как неестественный процесс Многие исследования...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...В Москве прошла первая стратегическая сессия «Информационные...
...Александр Антонов, руководитель группы оценки качества...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...Семантические издания Толстого, Пушкина и Чехова —...
...«Семантическое издание — это представление...
Онлайн-словарь диалектизмов «Русским языком говорю» должен объединить сотни слов, бытующих в разных регионах России. Это совместная инициатива портала «Культура.РФ» и социальной сети «Одноклассники». Например, словом сморщ в Брянской области называют борщ, а словом гостинка в Приморском крае — маленькую квартиру. Поиск по сайту позволяет найти диалектные слова по первой букве, по региону или по значению. Любой ...
...Проект «Русским языком говорю» собирает диалектные...
...Онлайн-словарь диалектизмов «Русским языком говорю...