Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Чемпионат сочинений — это альтернатива традиционным олимпиадам. На нем нет готовых тем: задания сформулированы в виде задач, которые нужно решить с помощью текста, написанного «своими словами». Как объясняет доцент факультета гуманитарных наук НИУ ВШЭ, руководитель Лаборатории развития интеллектуальных состязаний и председатель экспертного жюри Михаил Павловец, чемпионат проверяет «не знания, а умение эти знания транслировать на самые разные аудитории, и ...
...Чемпионат сочинений — это альтернатива традиционным...
23 декабря в 14:00 по московскому времени состоится онлайн-конференция «Как сделать классические тексты понятными современным школьникам: информационный ресурс „Слово Толстого“». Мероприятие посвящено запуску большого гуманитарного проекта — нового цифрового ресурса «Слово Толстого», созданного на основе 90-томника полного собрания сочинений Льва Толстого. В конференции примут участие: Фекла Никитична Толстая — руководитель проекта, руководитель ...
...23 декабря в 14:00 по московскому времени состоится...
21 марта — Международный день людей с синдромом Дауна. Тем, кто родился с этим синдромом, труднее реализовать потребность в общении и понимании информации, чем другим людям. Помогающие специалисты вместе с программистами и лингвистами создают для них специальные адаптированные тексты, инструкции и сервисы, которые облегчают коммуникацию. В последние годы в России было реализовано несколько инициатив в этом направлении. С 2021
...21 марта — Международный день людей с ...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Многие встречали утверждение, что мозг якобы игнорирует частицу не. Есть и другой взгляд: частица не меняет смысл слова на противоположный (не очень чистый — грязный), даже если это противоречит смыслу фразы. Благодаря новой работе исследователей из Нью-Йоркского университета появились дополнительные данные о восприятии отрицания. В серии экспериментов участники должны были читать прилагательные с отрицанием и без него (например, хороший —
...Многие встречали утверждение, что мозг якобы игнорирует...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
В последнее время устаревшая церковнославянская и конфессиональная лексика активно используются современными массмедиа. Рассчитанные на массового читателя и слушателя, современные массово-коммуникативные тексты, воспроизводя стандартные языковые модели, обращаются к устаревшей лексике для большей эмоциональности, экспрессивности.
...В последнее время устаревшая церковнославянская и конфессиональная...
...Исследователь проблем современного русского языка Е...
Сначала выучить китайский язык, потом заняться литературным переводом с китайского и, наконец, замахнуться на перевод поэзии! Со стороны такой путь представляется настоящим геройством. Китаист Юлия Дрейзис рассказала Грамоте о главных барьерах на пути переводчика современной китайской поэзии и о разных приемах, которые помогают передать по-русски самые существенные черты оригинала.
...Сначала выучить китайский язык, потом заняться литературным...
...По меткому выражению современного китайского поэта...