Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Ной Вебстер родился 16 октября 1758 года и прожил 84 года. За это время он успел организовать несколько школ и реформировать систему образования, затронуть в своей публицистике множество актуальных социальных и научных вопросов, внести заметный вклад в политическую жизнь Америки и остаться в истории двумя уникальными печатными трудами: «Пособием по американскому правописанию» и «Американским словарем английского языка».
...Ной Вебстер родился 16 октября 1758 года и прожил 84...
...Не только словарь За свою долгую жизнь Ной Вебстер...
Выбором «слова года» занимаются авторитетные словари, языковые институты, газеты и сайты. С недавнего времени такую акцию проводит и Грамота. Чем отличается наш подход к определению «слова года»? Как мы собираем данные, фильтруем и оцениваем их? Приоткрываем дверь на нашу социолингвистическую кухню. И предупреждаем: у большого «слова года» будет свита из «главных слов» в разных сферах.
...Выбором «слова года» занимаются авторитетные...
...Вторые «выборы»: развиваем методологию...
Фразеология часто оказывается самой непонятной частью языка не только для иностранцев, но и для младших поколений, которые редко встречали и никогда не употребляли выражения вроде «семь пятниц на неделе». Многие идиомы кажутся устаревшими и ассоциируются с речью бабушек и дедушек. Но никогда не поздно разобраться, какой смысл имеют истории про белок, комаров, баранов и молочные реки, даже если вы сами использовать эти выражения не собираетесь. Мы выбрали семь идиом, которые чаще других ищут на Грамоте — и не находят! Самое время дополнить Справочник по фразеологии.
...Фразеология часто оказывается самой непонятной частью...
...Крутиться как белка в колесе Образ. Белка, которая...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Грамота: Все, кто работает с языком как исследователи...
Лингвист Юлия Сафонова в статье для журнала «Наука и жизнь» анализирует непонятное современнику употребление слова «шофер».
...Лингвист Юлия Сафонова в статье для журнала «...
...Писатель Дмитрий Григорович в беседе с Достоевским...
На обновленной Грамоте образовательное направление становится одним из главных. Мы хотим как можно более понятно и подробно объяснять, как устроены правила, в чем их логика и узкие места, как проще их запомнить. Учебные материалы обращены не только к учителям и школьникам, но и к тем взрослым, кто хочет увереннее себя чувствовать, когда говорит и пишет на родном языке. Мы попросили руководителя направления Марию Юрьевну Лебедеву рассказать о том, как будет устроен образовательный трек.
...На обновленной Грамоте образовательное направление...
...Начну с признания. Русский язык в школе я не очень-то...
Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.
...Уже сейчас писатели издают книги, которые написаны...
...Кто лучше напишет рассказ? В ходе эксперимента писателю...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...
22 ноября отмечается День словарей и энциклопедий. Это день рождения Владимира Даля, создателя «Толкового словаря живого великорусского языка», внесшего огромный вклад в развитие русского языка и российской лексикографии. В 2016 году Институт русского языка им. В. В. Виноградова создал научно-информационный орфографический ресурс «Академос», который постоянно пополняется. В 2023 году в него было добавлено более ста новых статей. Среди них есть слова и ...
...22 ноября отмечается День словарей и энциклопедий....