Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Слово и его окружение Идея представления слова...
О характерных чертах языка нейросетей и перспективах его влияния на наши речевые привычки изданию «Социодиггер» рассказал доцент НИУ ВШЭ, старший научный сотрудник ИРЛИ РАН Борис Орехов.
...О характерных чертах языка нейросетей и перспективах...
...Машинный диалект: границы рефлексии...
...Многие восхищаются тем, как хорошо нейросети научились...
Перевести набоковские образы часто невозможно не только на другой язык, но и интермедийно: как должно быть визуально представлено то, что может воплощаться только в слове? Этим вопросом задались лингвисты Любовь Каракуц-Бородина и Борис Орехов.
...Перевести набоковские образы часто невозможно не только...
...Нейросеть создала иллюстрации к Набокову...
...Они подготовили выставку для Музея Владимира Набокова...
Нейросети уже неплохо справляются с анализом и порождением текстов, они умеют многое из того, что раньше делали только люди. Какие возможности это дает? Участники круглого стола «Ай да AI. Нейросети и создание текстов: проблемы и перспективы генеративных моделей» обсудили, чем ИИ может помочь в научной работе и какие навыки понадобятся людям в цифровую эпоху. Грамота записала самое главное.
...Нейросети уже неплохо справляются с анализом и...
...Что нейросети умеют делать с текстами и чем предстоит...
...В дискуссии на Костомаровском форуме участвовали руководитель...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Новый подход поможет людям более успешно общаться с...
...Большие языковые модели — подобные тем,...
День русского языка традиционно отмечается в день рождения Александра Сергеевича Пушкина. В пресс-конференции участвуют: — член Совета при Президенте Российской Федерации по русскому языку Константин Деревянко; — и. о. ректора Государственного института русского языка им. А. С. Пушкина Наталья Трухановская; — доцент Школы лингвистики НИУ ВШЭ, старший научный сотрудник Института русской литературы (Пушкинского дома) РАН Борис Орехов; — главный редактор ...
...6 июня в пресс-центре «Россия сегодня» пройдет пресс-конференция...
...День русского языка традиционно отмечается в день рождения...
Все выпуски можно посмотреть на канале Института русского языка им. В. В. Виноградова и на канале передачи «Говорим по-русски».
...Все выпуски можно посмотреть на канале Института русского...
...«Говорим по-русски!» с Ольгой Северской: обзор программ...
...Церковнославянский и древнерусский. Известно, что в...
О запуске большого гуманитарного проекта будет официально объявлено в день рождения великого русского лексикографа Владимира Даля. «Слово Толстого» — цифровая платформа, созданная на основе 90-томного полного собрания сочинений Льва Толстого. Проект не только обеспечивает свободный доступ ко всем толстовским текстам (это было сделано на начальном этапе работы с полным собранием сочинений писателя в проекте «Весь Толстой в один клик»), но главное — создает ...
...Цифровую платформу «Слово Толстого» запустят 22 ноября...
...О запуске большого гуманитарного проекта будет официально...
IV Костомаровский форум привлек значительный интерес общественности. Всего на него, по данным организаторов, зарегистрировались (для личного и дистанционного участия) 6734 представителя из 116 стран мира, сайт форума посетили почти 80 тыс. человек. Программа включала 53 мероприятия, в том числе конференции, панельные дискуссии, круглые столы, мастер-классы, презентации образовательных проектов и научных исследований. Представители Грамоты ...
...В Институте Пушкина завершился IV Костомаровский форум...
...IV Костомаровский форум привлек значительный интерес...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Состоялся запуск масштабного цифрового проекта «Слово...
...Проект «Слово Толстого» — цифровой...