Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Сериал «Слово пацана», который активно обсуждают уже почти два месяца, заинтересовал нас не только словом «чушпан», которое даже называли в качестве кандидата на роль слова года. Насколько точно на экране передан сленг улицы в целом? Грамота поговорила об этом Шамилем Идиатуллиным, который в 1980-е годы жил в городе Брежнев (ныне Набережные Челны) и написал об этом времени книгу.
...Сериал «Слово пацана», который активно...
...В «Слове пацана» есть хорошая фактическая...
На нашей планете тысячи языков. Они относятся к разным языковым группам и семьям, а диалекты внутри них могут отличаться настолько сильно, что специалисты спорят, не стоит ли их считать отдельными языками. Почему это многообразие нас так завораживает? Возможно, одну из причин назвал Петр Вяземский: «Язык есть исповедь народа: в нем чудится его природа, его душа и быт родной».
...На нашей планете тысячи языков. Они относятся к разным...
...Мы выбрали для вас несколько книг об историческом развитии...
Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...До нас дошел очень большой массив рукописей на церковнославянском...
Руководитель Федеральной службы по надзору в сфере образования и науки (Рособрнадзора) Анзор Музаев поддержал идею приема в российские школы детей иностранцев только в том случае, если они владеют русским языком. В июне с таким предложением выступила группа депутатов ЛДПР. «Если ты приезжаешь сюда с семьей и собираешься стать гражданином или временно жить, если ты хочешь, чтобы твои дети получали в этой стране образование, то они должны ...
...Руководитель Федеральной службы по надзору в ...
Статьи номера посвящены произношению согласных, восприятию диалекта, карнавализации, семантике глагольных циркумфиксов и слова «Земля», а также языку образов времени и языку художественной литературы. Отметим некоторые из них.
...Статьи номера посвящены произношению согласных, восприятию...
...К семантике русских глагольных циркумфиксов. Циркумфикс...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Вы не находите, что за последнее время русский язык сильно испортился? Давайте узнаем, как отвечают на этот вопрос специалисты. Многие книги из этой подборки переиздавались уже не раз, но неизменно исчезают из магазинов. Известные лингвисты напоминают нам о том, что язык меняется и он неотделим от жизни. Эти книги легко читать, они подарят вам не только знания, но и положительные эмоции.
...Вы не находите, что за последнее время русский язык...
... 1. Мария Елифёрова. Панталоны, фрак, жилет...
Проблемы, которые мы здесь обсуждаем, в конечном итоге сводятся к оценке состояния русского языка, и зеркалом этого состояния является язык средств массовой информации. Само слово «состояние» заряжено негативной оценкой, предполагает какие-то дефекты в предмете. Ср. «состояние больного внушает опасения», «состояние конструкции здания чревато опасностями» и т. п. Но когда мы говорим о состоянии языка, мы разве озабочены разрушением его морфологического строя? Или нас настораживают изменения в его фонетике, в его синтаксисе?
...Проблемы, которые мы здесь обсуждаем, в конечном итоге...
...Нет, структурная его организация вполне благополучна...