Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Многие из тех, кто учил иностранный язык в школе, признаются, что умеют рассуждать о мировой политике или защите окружающей среды, но теряются, когда нужно правильно назвать венчик для взбивания, определенный вид встроенного шкафа или шапочку с помпоном. В процессе перевода тоже возникают похожие трудности с конкретной лексикой, когда одним словом могут быть названы очень разные предметы. Переводчик с итальянского Анна Ямпольская рассказала Грамоте, на какие ухищрения приходится идти, чтобы отличить пиджак от куртки, а панаму от ушанки.
...Многие из тех, кто учил иностранный язык в школе, признаются...
...Как известно, костюм — одна из важнейших характеристик...
Носители языка не всегда могут уследить за тем, что лингвисты тщательно фиксируют в словарях, правда, всегда с опозданием: одни слова вдруг появляются ниоткуда или становятся модными в силу ситуации, а другие постепенно выходят из употребления, устаревают и исчезают. У переводчика в этом отношении есть преимущество: он смотрит на чужой язык со стороны и более чувствителен к изменениям. Переводчик-японист Екатерина Тарасова рассказала Грамоте о новых явлениях в японском языке.
...Носители языка не всегда могут уследить за тем, что...
...В Японии очень внимательно относятся к неологизмам....
Сегодня специалисты согласны в том, что сложные системы коммуникации есть не только у людей. Понимание того, как общаются животные, может дать представление об их социальных структурах и поведении и улучшить жизнь одомашненных видов. Прогресс в этом направлении обеспечивают нейросети, которые анализируют большие объемы информации и находят неочевидные закономерности. Исследователи из канадского Университета Далхаузи использовали методы обработки естественного языка ...
...Сегодня специалисты согласны в том, что сложные...
Ведущая рубрики «Русский устный», член редакционного совета портала «Грамота.ру» Юлия Сафонова разбирает выражение «таскать каштаны из огня», а также приводит другие выражения со сходным значением.
...Ведущая рубрики «Русский устный», член...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...
Русский язык в XVIII веке, обогащаясь заимствованиями, диалектизмами, преувеличенно галантными формами и живым просторечием, постепенно вытеснил из книжной сферы церковнославянский. За изменениями последовали горячие дискуссии о грамматике и языковых правилах, которые бы регулировали письменную речь. Но этот язык все еще существенно отличался от современного русского языка. Знакомый нам литературный русский язык окончательно сформировался в произведениях Александра Сергеевича Пушкина, рожденного в конце XVIII столетия. Поэтому тексты, созданные в XVIII веке, в целом понятны современному читателю, хотя некоторые слова, формы и конструкции могут показаться незнакомыми. Давайте проверим, насколько хорошо вы понимаете русский язык XVIII века.
...Русский язык в XVIII веке, обогащаясь заимствованиями...
...Язык эпохи Екатерины II Специальный проект...
В русском языке глагол-сказуемое согласуется с подлежащим по лицу и числу в настоящем времени и по роду и числу в прошедшем. Когда подлежащее выражено одним словом — существительным или местоимением, с согласованием не возникает проблем. Но если подлежащее нетипичное, возможны разные варианты. Применить корпусные методы к таким конструкциям сложно, потому что в корпусе они почти не встречаются. Но можно изучать их методами экспериментального синтаксиса.
...В русском языке глагол-сказуемое согласуется с подлежащим...
...Три стратегии выбора Мы будем рассматривать случаи...
На YouTube-канале «Основа», который ведет режиссер и блогер Борис Веденский, уже год регулярно появляются интервью со специалистами в разных областях и представителями разных наук, которые умеют популяризировать научные знания, заинтересовывать своей областью самую широкую аудиторию. Гостями канала уже побывали лингвисты Владимир Пахомов, Федор Успенский, Игорь Исаев, Георгий Старостин.
...На YouTube-канале «Основа», который ведет...
...Александр Пиперски в разговоре с ведущим...
К числу включенных в декабре 2023 года слов, называющих актуальные явления и предметы, относятся, например, датасет, ИИ, ИТ-профессия, ИТ-специалист, косплей, косплейный, косплеер, майнинг, маркетплейс, медиакарта, мурал, инвестиционно привлекательный. Словарь также пополнили термины разных специальностей и областей знания, например: благополучатель, инофон (человек, не владеющий русским языком, для которого русский язык неродной, дети-инофоны), каподастр (ограничитель на грифе ...
...К числу включенных в декабре 2023 года слов, называющих...