Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
О характерных чертах языка нейросетей и перспективах его влияния на наши речевые привычки изданию «Социодиггер» рассказал доцент НИУ ВШЭ, старший научный сотрудник ИРЛИ РАН Борис Орехов.
...О характерных чертах языка нейросетей и перспективах...
...Многие восхищаются тем, как хорошо нейросети научились...
Перевести набоковские образы часто невозможно не только на другой язык, но и интермедийно: как должно быть визуально представлено то, что может воплощаться только в слове? Этим вопросом задались лингвисты Любовь Каракуц-Бородина и Борис Орехов.
...Перевести набоковские образы часто невозможно не только...
...Они подготовили выставку для Музея Владимира Набокова...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...
Нейросети уже неплохо справляются с анализом и порождением текстов, они умеют многое из того, что раньше делали только люди. Какие возможности это дает? Участники круглого стола «Ай да AI. Нейросети и создание текстов: проблемы и перспективы генеративных моделей» обсудили, чем ИИ может помочь в научной работе и какие навыки понадобятся людям в цифровую эпоху. Грамота записала самое главное.
...Нейросети уже неплохо справляются с анализом и...
...В дискуссии на Костомаровском форуме участвовали руководитель...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
День русского языка традиционно отмечается в день рождения Александра Сергеевича Пушкина. В пресс-конференции участвуют: — член Совета при Президенте Российской Федерации по русскому языку Константин Деревянко; — и. о. ректора Государственного института русского языка им. А. С. Пушкина Наталья Трухановская; — доцент Школы лингвистики НИУ ВШЭ, старший научный сотрудник Института русской литературы (Пушкинского дома) РАН Борис Орехов; — главный редактор ...
...День русского языка традиционно отмечается в день рождения...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...Системы распознавания речи работают с последовательностью...
Всем, кто имеет отношение к организации Тотального диктанта, творчество Евы Даласкиной знакомо отлично. Еще в 2015 году кто-то из «диктаторов» произнес: «Сейчас мы напишем текст Е. Водолазкина», — а кто-то из «диктантеров» записал имя автора так: «Ева Даласкина». С тех пор все нелепицы, которые обнаруживают проверяющие в текстах диктанта, приписываются этой авторессе.
...Всем, кто имеет отношение к организации Тотального...
...Заслуженная популярность Ева Даласкина, будем честны...