Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В 2024 году Грамота предложила филологам оценить одиннадцать слов, которые удовлетворяли нашим критериям и поэтому вошли в шорт-лист «слов года». Вот эти слова: инсайт, вайб, нарратив, абьюз, аскеза, осознанность, прилет, пов, сап, скуф и нормис. Мы попробуем показать, чем интересны эти слова, а заодно ответим на самые распространенные вопросы: почему тут есть слова, которых никто не знает, почему тут есть слова, которые все давно знают, и, наконец, почему в этом списке сплошные заимствования?
...В 2024 году Грамота предложила филологам оценить...
...Неожиданный список Новые и старые Начнем, пожалуй...
8 сентября — Международный день грамотности. Уровень грамотности в России — один из самых высоких в мире. По последним данным Института статистики ЮНЕСКО, он составляет 99,93%. Кроме того, Россия находится на втором месте в мире по числу публичных библиотек: их 46 тысяч. Ее обходит только Китай, где их больше 51 тысячи. Но всеобщее умение читать и писать — цель, которая была достигнута в нашей стране еще в
...8 сентября — Международный день грамотности...
В любой библиотеке мира словари русского языка будут занимать бесконечные ряды полок. Найти можно все: от словаря языка Пушкина до словаря названий рыб. Что ждет словари в XXI веке: останутся ли они памятниками прошлого или обретут новую жизнь благодаря цифровым технологиям? Лингвист, руководитель ИИ-направления Грамоты Михаил Копотев описал для нас в общих чертах три с лишним века русской лексикографии.
...В любой библиотеке мира словари русского языка будут...
...Лексиконы эпохи Просвещения выражали новые понятия...
Международная акция «Тотальный диктант» пройдет 20 апреля уже в двадцать первый раз. Ее цель — объединить всех, кто любит русский язык, хочет лучше писать и говорить по-русски. Кроме того, диктант знакомит участников с современной литературой на русском языке: автором текста диктанта каждый год выбирают российского писателя. В 2024 году им стала Анна Матвеева, известная благодаря роману «Перевал Дятлова, или Тайна девяти». Вот ...
...Международная акция «Тотальный диктант»...
Вопрос, когда и где зародилась письменность, уже долгие годы является предметом научных дискуссий. Предшественниками письма считаются, например, глиняные таблички, которые древние шумеры оставляли в залог товаров. Их возраст — около десяти тысяч лет. Однако протописьмо, возможно, возникло раньше. На это могут указывать записи в храмовом комплексе Гёбекли-Тепе, изученные археологами из Эдинбургского университета (Великобритания). Постройки Гёбекли-Тепе находятся на ...
...Вопрос, когда и где зародилась письменность, уже...
В интернете мы ведем диалоги и групповые беседы, обмениваясь текстовыми сообщениями. Как отмечают лингвисты, технологический прогресс породил новый вариант языка — устно-письменный язык интернета. Об особенностях этого явления рассказала доктор филологических наук Наталья Клушина в новом выпуске «Трудов Института русского языка им. В. В. Виноградова».
...В интернете мы ведем диалоги и групповые...
...Главная особенность коммуникации в интернете ...
18 декабря в пространстве «Кибердом» были названы победители конкурса лучших сайтов и приложений российского сегмента интернета. Конкурс «Золотой сайт + золотое приложение» проводится ежегодно с 1997 года, но в этом году награду вручали за достижения 2023 года, когда состоялся перезапуск Грамоты. Сайты-претенденты оценивает жюри, состоящее из профессионалов отрасли. В конкурсе 88 разных номинаций, Грамота участвовала ...
...18 декабря в пространстве «Кибердом...
Исследование, проведенное на платформе онлайн-рекрутинга hh.ru, показало, что среди слов и фраз, которые вызывают наибольшее раздражение, лидируют уменьшительно-ласкательные формы, такие как человечек и задачка. На втором месте по частоте упоминания — слово засинкаться, а также родственные ему синк и синкануться (от англ. synchronization ‘синхронизация’ в значении ‘встреча, позволяющая синхронизировать работу команды’). Эти слова упомянули 21% ...
...Исследование, проведенное на платформе онлайн-рекрутинга...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...Системы распознавания речи работают с последовательностью...