Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Источники и причины появления новых слов Многие слова, которые мы сегодня воспринимаем как привычные и существовавшие всегда, когда-то были новыми единицами. Так, слово столица образовано от слова стол при помощи суффикса -иц-, но со временем эта связь перестала ощущаться: сегодня мы не видим в слове столица то значение, которое есть у стола. А во многих случаях слова, когда-то послужившие основой для новых, сами ушли из языка: говядина (от ст.-слав. говѩдо — крупный рогатый ...
...Источники и причины появления новых слов Многие слова...
Число текстов, сгенерированных искусственным интеллектом, в последние годы растет в геометрической прогрессии. И качество таких текстов постоянно улучшается. А это значит, что определить, к примеру, реальное авторство учебной работы будет все труднее. Ведь текст, порожденный нейросетями, выглядит уникальным, его не распознаёт проверка инструментами вроде «Антиплагиата». Однако справиться с этой задачей обещают исследователи Высшей школы экономики.
...Число текстов, сгенерированных искусственным интеллектом...
Правительство РФ внесло в Госдуму законопроект о создании Национального словарного фонда — единого цифрового ресурса, содержащего данные словарей русского языка. Закон «О государственном языке РФ» предлагается дополнить статьей, которая будет регламентировать создание и работу Национального словарного фонда. Под ним понимается государственная информационная система, в которой будут представлены данные о нормах современного русского ...
...Правительство РФ внесло в Госдуму законопроект...
И пользователи Грамоты, и те, кто предпочитает бумажные издания, часто замечают, что один словарь рекомендует одно ударение, другой — другое, а третий вообще приводит оба варианта как равноправные. Если один словарь разрешает «кофе» в среднем роде, а другой возражает против такой вольности, кому верить? Ответ неочевиден, поскольку универсального словаря на все случаи жизни не существует. Более того, не все словари ставят перед собой задачу зафиксировать строгую норму. Как же тогда выбрать правильный вариант, какие критерии использовать, на что обращать внимание? Попробуем разобраться.
...И пользователи Грамоты, и те, кто предпочитает бумажные...
...Словари прескриптивные и дескриптивные Литературная...
Вопрос о возможности заменить отчество на матчество в официальных документах вызывает сегодня бурные дискуссии, хотя это явление не так чуждо русской культуре, как может показаться.
...Вопрос о возможности заменить отчество на матчество...
...Древнерусские матери Для нас привычно, что у человека...
Школьники не могут освоить правописание из-за скудного словарного запаса, а сами учителя иногда перенимают сленг учеников. Таковы результаты опроса участников олимпиады «Хранители русского языка». Правописание считают самым сложным разделом для изучения в школе 40% опрошенных учителей русского языка. На втором месте пунктуация (24%), а на третьем — культура речи и стилистика (23%). Распространенные причины проблем с русским языком — бедный словарный запас и ...
...Школьники не могут освоить правописание из-за скудного...
4 апреля в пресс-центре ТАСС состоялась пресс-конференция, посвященная созданию государственной информационной системы «Национальный словарный фонд». Это электронная информационная система с открытым доступом, имеющая разные модули, которая позволяет получить информацию как о текущем словарном составе русского языка, так и о его истории на протяжении почти трехсот лет. Минобрнауки выступает оператором и разработчиком проекта, работы над ним ведутся ...
...4 апреля в пресс-центре ТАСС состоялась пресс-конференция...
Национальный словарный фонд (НСФ) — федеральная государственная информационная система (ФГИС), предоставляющая совокупность информации о нормах современного русского литературного языка, закрепленных в нормативных словарях, а также в словарях, фиксирующих сведения о развитии норм русского литературного языка. Создание НСФ предусмотрено поправками в федеральный закон «О государственном языке Российской Федерации».
...Национальный словарный фонд (НСФ) — федеральная...
Появление интернета как общедоступного пространства общения породило новое языковое разделение. Язык блогов, форумов и соцсетей, не скованный литературными и типографскими нормами, теперь существует параллельно с языком традиционных СМИ. Но граница между ними проницаема: медиа и сами живут на территории интернета, а «зумерский» сленг и новые понятия легко проникают в серьезные газеты и журналы.
...Появление интернета как общедоступного пространства...
...Чем отличается язык молодежи Традиционные СМИ ориентируются...