Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Команда Грамоты за прошедшую неделю внесла несколько обещанных изменений в работу обновленного портала: размер поля для вопроса справочной службе увеличился до 1000 символов; добавлена возможность использовать в поисковой строке символы (* и ?), что позволяет искать в текстовых материалах сразу группу похожих слов; для большинства словарей в словарных статьях, которые появляются в результатах поиска, воспроизводится их исходная разметка. Кроме того, мы теперь с ...
...Команда Грамоты за прошедшую неделю внесла несколько...
Чтение — одно из самых популярных хобби. Однако доля людей, читающих для удовольствия, неуклонно снижается — об этом говорят данные из США. Исследователи из Университетского колледжа Лондона и Университета штата Флориды (США) решили оценить, насколько серьезен этот спад. Они взяли данные из Американского обзора использования времени (American Time Use Survey), который ежегодно проводится Бюро переписи населения США и Бюро статистики труда.
...Чтение — одно из самых популярных хобби...
После того как в среду, 22 ноября, портал Грамоты был перезапущен в новом дизайне и с новой поисковой системой, команда внимательно следила за реакцией пользователей. Анализ обратной связи позволяет нам совершенствовать работу портала. Вот некоторые изменения, которые были внесены: большинство ссылок и редиректов стали работать корректно; снижен порог, отсекающий в выдаче нерелевантные ответы справочной службы, — теперь пользователи видят гораздо больше ответов;
...После того как в среду, 22 ноября, портал Грамоты был...
Вечером 16 сентября в Москве назвали имена лауреатов юбилейного, XX сезона премии «Ясная Поляна», сообщает сайт «Год литературы». Церемония, раньше традиционно проходившая в Бетховенском зале Большого театра, впервые состоялась на Новой сцене. Изменилась и дата: вместо октября премию решили вручить, не отходя далеко от дня рождения Льва Николаевича Толстого, которое отмечалось за неделю до этого, 9 сентября. Лауреатом премии за вклад в литературу стал советский и ...
...Вечером 16 сентября в Москве назвали имена лауреатов...
Пока политики ищут национальную идею, которая смогла бы консолидировать общество, такая идея, как представляется, уже овладела умами россиян: самоидентификация идет в поле русского языка. Трехлетний опыт общения с аудиторией программ «Как правильно?» и «Говорим по-русски!» (а вопросы от слушателей поступают к нам из более чем 70 городов России от носителей языка самых разных возрастов и социального положения, что позволяет считать нашу многомиллионную аудиторию неким представительным срезом общества) показывает: реформа орфографии заставляет испытывать тревогу и вызывает не меньший, если не больший интерес, чем проводимые экономические и социальные реформы.
...Пока политики ищут национальную идею, которая смогла...
...Своеобразным пропуском в элиту общества кажется не...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...
Родству языков посвящена такая область лингвистики, как сравнительно-историческое языкознание, или компаративистика. Ученые сравнивают родственные языки между собой, прослеживают эволюцию, реконструируют общий праязык. Один из инструментов для оценки степени родства языков разработал американский лингвист Моррис Сводеш. Его так и называют — список Сводеша.
...Родству языков посвящена такая область лингвистики,...
...Жизнь и карьера Морриса Сводеша Моррис Сводеш...
В 2023 году 13,4% европейцев покупали печатные книги в интернете. Тех же, кто заказывал электронные издания, оказалось почти в два раза меньше (7,2%). Доля последних растет, но незначительно (в 2022 году таких было 6,6%). Такие данные приводит статистическая служба Европейского Союза — Евростат. Только в Дании и Финляндии покупки электронных книг явно преобладали. Стоит учесть, что исследователи оценивали онлайн-заказы и не учитывали покупки ...
...В 2023 году 13,4% европейцев покупали печатные...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В последнее время искусственный интеллект далеко...