Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Каждый день мы сталкиваемся с огромным количеством больших и маленьких текстов, но не всегда нам удается сразу осознать прочитанное. Что такое читательская грамотность и почему ее важно развивать? Грамота публикует статью нашего партнера, Всероссийского чемпионата сочинений «Своими словами», которая помогает увидеть сбои в логике, фантазии, преувеличения и неправомерные обобщения там, где при обычном чтении мы не замечаем ничего подозрительного.
...Каждый день мы сталкиваемся с огромным количеством...
...Почему мы можем неверно понять текст Чтобы разобраться...
Откуда у слов «липа» и «липовый» появилось значение «нечто фиктивное, подложное»? Отвечает журнал «Наука и жизнь».
...Откуда у слов «липа» и «липовый»...
...Негативная коннотация у слов липа и липовый связана...
Баски, уже многие сотни лет живущие в предгорьях Пиренеев на границе Испании и Франции (именно в их честь получил свое название Бискайский залив), — удивительный и загадочный народ, культура и язык которого совсем не похожи на культуру и языки других народов Южной Европы. Вот и правила образования числительных (да и сами их названия) в баскском языке весьма своеобразны. Предлагаем решить лингвистическую задачу про баскские числительные, опубликованную в журнале «Наука и жизнь».
...Баски, уже многие сотни лет живущие в предгорьях Пиренеев...
...Даны арифметические примеры на умножение на баскском...
Команда ученых из Италии, США и Швейцарии проверила, насколько хорошо большим языковым моделям удается убеждать собеседников в своей правоте. Авторы привлекли к участию 900 жителей США. Каждому из них случайным образом выдали собеседника (это мог быть другой участник или чат GPT-4), тему и задачу — защищать или оспаривать предложенный тезис. Также в одном из вариантов участнику (человеку или чат-боту) была заранее доступна информация о
...Команда ученых из Италии, США и Швейцарии проверила...
О запуске большого гуманитарного проекта будет официально объявлено в день рождения великого русского лексикографа Владимира Даля. «Слово Толстого» — цифровая платформа, созданная на основе 90-томного полного собрания сочинений Льва Толстого. Проект не только обеспечивает свободный доступ ко всем толстовским текстам (это было сделано на начальном этапе работы с полным собранием сочинений писателя в проекте «Весь Толстой в один клик»), но главное — создает ...
...О запуске большого гуманитарного проекта будет официально...
В этом году конференция проходит на базе Рязанского государственного университета им. Есенина. На ней будут представлены доклады, посвященные поэтонимии драматургии, этимологизации топонимов, неофициальной онимии и ономастическому пространству Рязанского края, а также другим темам. В частности, доктор филологических наук, ведущий научный сотрудник отдела прикладной лингвистики Института языкознания РАН Юлиана Юрьевна Гордова расскажет о состоянии и перспективах ...
...В этом году конференция проходит на базе Рязанского...
Мария Леонидовна Каленчук — главный научный сотрудник и заведующая отделом фонетики Института русского языка им. В. В. Виноградова РАН, член Совета по русскому языку при Президенте РФ, член Орфографической комиссии и председатель Орфоэпической комиссии РАН, эксперт Грамоты. Ее монолог на «Арзамасе» начинается с детства, учебы в школе и в институте и заканчивается признанием в любви к фонетике и описанием процесса создания словарей. Мы выбрали пять цитат из этого монолога.
...Мария Леонидовна Каленчук — главный научный...
...Есть такой предмет «введение в языкознание...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Мир ономастики интересен тем, что позволяет через имена и названия многое узнать об истории и культуре. Одних только русских фамилий насчитывается более 200 тысяч! Собранные под одной цифровой обложкой печатные выпуски уникальной газеты будут интересны широкой аудитории, особенно учащимся, школьным учителям и преподавателям вузов.
...Мир ономастики интересен тем, что позволяет через имена...
...Мы живем в мире имен и названий. Практически любое...