Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Какую опасность таит в себе Интернет с точки зрения филолога-русиста? Опасность размывания орфографических, грамматических и лексико-стилистических норм, разрушения границ жанра. Может ли Интернет сослужить пользу в благородном деле возрождения культуры речи, популяризации русского языка и поддержания его литературных норм? Безусловно, да, так как Интернет предоставляет безграничные возможности для обсуждения проблем существования и развития современного русского литературного языка, для распространения правил и норм его употребления.
...Какую опасность таит в себе Интернет с точки зрения...
...Нет никаких сомнений в том, что русский Интернет...
Среди слов, собранных в разных регионах России школьниками — участниками проекта «Слова для своих», встречаются и обозначения местной нечисти. Представления о ней восходят порой к весьма древним верованиям. В святочной колонке Ирины Фуфаевой речь пойдет о словах, которые не имеют однословных аналогов в литературном языке, да и вообще с трудом поддаются точному толкованию.
...Среди слов, собранных в разных регионах России...
...Денотат — это сущность реального мира, которая...
Новый Центр переводческой практики восточных и африканских языков позволит студентам получать опыт работы при выполнении переводов для партнерских организаций. Об этом сообщил первый заместитель декана восточного факультета СПбГУ Алексей Родионов на церемонии открытия Центра. На восточном факультете изучают 62 языка; в нынешнем году к ним добавились сомалийский и казахский. Как отметила первый проректор университета Марина Лаврикова, Центр работает по уникальной ...
...Новый Центр переводческой практики восточных и ...
В Год семьи Российский книжный союз совместно с Русской школьной библиотечной ассоциацией запустил проект «Читающая мама», направленный на популяризацию традиций семейного чтения. Родителей призывают уделять этому занятию хотя бы десять минут в день. Авторы перечисляют те задачи, которые можно решить благодаря регулярному чтению детям; в их числе — развитие речи, развитие навыков чтения и воображения, формирование эмоционального ...
...В Год семьи Российский книжный союз совместно с ...
Чужой опыт, рекомендации придерживаться определенных правил вряд ли могут сыграть решающую роль в такой свободолюбивой среде, как Глобальная Сеть. И все же наблюдение за процессом рождения правил поведения в интернете, которые заметно отличаются от этикета внесетевой реальности и уже даже получили специальное название — Netiquette, не только представляет академический интерес для лингвистов и культурологов, но и является важным с практической точки зрения.
...Чужой опыт, рекомендации придерживаться определенных...
...Ребенок воспитывался без родителей один, в интернете...
Говоря о выборе системы письма, мы не будем затрагивать вопросы исконного, если можно так выразиться, выбора: происхождения систем письма и формирования письменных ареалов. Далее будет говориться лишь о ситуации последних веков, включая современность.
...Говоря о выборе системы письма, мы не будем затрагивать...
...В это время уже не создаются новые системы письма (...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Мы продолжаем публиковать избранные статьи из архива журнала «Русский язык в школе». Это совместный проект портала «Грамота.ру» и редакции журнала, приуроченный к столетию со дня выхода первого номера. На Грамоте уже опубликованы статьи из номеров журнала, выходивших в свет в 1930-е и 1940-е годы. На очереди — 1950-е и характерная для того времени статья Виктора Левина в № 3 за 1952 год.
...Мы продолжаем публиковать избранные статьи из архива...
...Предисловие «Грамоты.ру» Начало 1950-...