Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Выбором «слова года» занимаются авторитетные словари, языковые институты, газеты и сайты. С недавнего времени такую акцию проводит и Грамота. Чем отличается наш подход к определению «слова года»? Как мы собираем данные, фильтруем и оцениваем их? Приоткрываем дверь на нашу социолингвистическую кухню. И предупреждаем: у большого «слова года» будет свита из «главных слов» в разных сферах.
...Выбором «слова года» занимаются авторитетные...
...Вторые «выборы»: развиваем методологию...
Что нужно, чтобы языковое явление получило статус нормативного? Почему лингвистов подозревают в безволии? Как от борьбы против любых новшеств наивные носители языка перешли к требованию узаконить собственные представления о правильном? О том, что именно общество одобряет и порицает, когда речь идет о нормах, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН Светлана Друговейко-Должанская рассказала в лекции «Наивный носитель языка и его бесценное мнение о норме». Грамота подготовила конспект этой лекции.
...Что нужно, чтобы языковое явление получило статус нормативного...
...Наивные и искушенные Выражение «наивный носитель...
За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».
...За двадцать лет Национальный корпус русского языка...
...Первые корпусы появились в 1960-х годах, но тогда...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
Устный перевод с турецкого сложен тем, что глагол стоит в конце фразы, поэтому синхронный перевод превращается, по сути, в очень быстрый последовательный. А что самое увлекательное в работе с письменными текстами? Мы спросили у тюрколога, переводчика, доктора филологических наук Аполлинарии Аврутиной, с какими самыми большими вызовами она сталкивалась при переводе художественной литературы. И услышали две яркие и поучительные истории.
...Устный перевод с турецкого сложен тем, что глагол...
...Работа, которой я горжусь до сих пор, —...
В Российской академии наук подготовлена новая, переработанная и значительно дополненная, редакция «Правил русской орфографии и пунктуации». Работа над ней велась давно, с начала 1990-х годов. Текст правил готовился коллективом специалистов сектора орфографии и орфоэпии Института русского языка им. В. В. Виноградова, а затем — на всех этапах работы — подробно рассматривался, обсуждался на заседаниях Орфографической комиссии при Отделении литературы и языка РАН.
...В Российской академии наук подготовлена новая, переработанная...
...В составе комиссии — не только работники Академии...
В России бок о бок с русскими столетиями живут другие коренные народы. Неизбежное в такой ситуации культурное взаимовлияние отразилось и на языке. Известно, что такие слова, как «казна», «деньги», «таможня» и многие другие, имеют тюркское происхождение и связаны с ордынским владычеством. А какие заимствованные из русского языка слова вошли в языки народов России? Для примера возьмем якутский, татарский, чеченский и коми-пермяцкий языки.
...В России бок о бок с русскими столетиями живут другие...
...Русский язык, будучи государственным, не мог не повлиять...
Акции, которые проверяют умение грамотно писать, позволяют участникам вспомнить то, чему их учили в школе, расширить словарный запас и почувствовать себя частью большого сообщества, говорящего на одном языке. В мире проводится несколько подобных акций, у каждой из них — своя история и свои особенности. Обычно это либо диктант для всех желающих, либо соревнования по спеллингу. По случаю двадцатилетнего юбилея нашего Тотального диктанта мы решили рассказать о некоторых других общенациональных праздниках грамотности.
...Акции, которые проверяют умение грамотно писать, позволяют...
...Французские культурные диктанты По легенде, Евгения...
В мире насчитываются тысячи языков, на которых говорят миллиарды людей. И тем не менее энтузиасты продолжают изобретать все новые искусственные языки разной степени проработанности — от пары фраз до полноценного словаря и грамматики. На какие группы делятся сконструированные языки — конланги — и для кого они предназначены?
...В мире насчитываются тысячи языков, на которых...
...Какие бывают конланги Одни конланги основаны на уже...