Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Пользователи Грамоты часто задают справочной службе вопрос о том, как писать какое-нибудь слово — с большой или с маленькой? «Транссибирская» или «транссибирская» магистраль, «Танины» или «танины» вещи, «Председатель» или «председатель», и, наконец, «Вы» или «вы»? Выбор между строчной и прописной буквой в русском правописании действительно устроен непросто. Он во многом определяется традицией, а правила, которые его регулируют, несколько раз менялись.
...Пользователи Грамоты часто задают справочной службе...
...Без больших букв можно обойтись? Различие между строчными...
Даже носителей языка могут ставить в тупик некоторые фразы. Например, как правильно сказать — те, кто пришел или те, кто пришли? А может, оба варианта допустимы? А как объяснить неносителю, почему мы говорим Петя и я придем, а не Петя и я придут? Почему в синтаксисе возникают разные варианты и всегда ли один из них хуже другого? Это и другие вопросы, связанные со строением предложения в русском ...
...Даже носителей языка могут ставить в тупик некоторые...
В среду, 12 февраля, Рособрнадзор опубликовал проект приказа о введении теста на знание русского языка для допуска в школы детей иностранных граждан. Для успешной сдачи теста необходимо получить 30% от максимального числа баллов. Этот порог един для всех возрастов. Приказ должен вступить в силу с 1 апреля 2025 года, одновременно с законом, запрещающим принимать в российские школы детей мигрантов, не справившихся с тестом на знание русского языка. Некоторые ...
...В среду, 12 февраля, Рособрнадзор опубликовал...
Выпускников и девятиклассников больше всего пугают ЕГЭ и ОГЭ по русскому языку, показал опрос, проведенный платформой онлайн-образования «Умскул» (о его результатах сообщает Газета.ru). Следом идет математика (из-за нее тревожатся 17% одиннадцатиклассников и 25% девятиклассников), на третьем месте — обществознание (15% и 10%). Опрошенные считают, что результат в большей степени зависит от качества подготовки и объема знаний (85%), а также от везения (48%) и уровня стресса (43%).
...Выпускников и девятиклассников больше всего пугают...
Исследователи из разных областей науки — лингвисты, зоопсихологи, биологи — много лет пытаются расшифровать системы коммуникации других видов. И заодно понять, что же представляет собой речь, если ей владеем не только мы. Грамота попыталась разобраться, к каким выводам они пришли на сегодняшний день.
...Исследователи из разных областей науки —...
...Человеческий язык — что в нем такого...
Когда-то мы смеялись над корявостью и глупостью первых языковых моделей. Сегодня чат-боты пишут за людей деловые письма и посты, сочиняют рассказы, ведут задушевные беседы и приводят аргументы в спорах. Есть ли что-то, чем речь машины в корне отличается от человеческой? И может ли эксперт — или даже другая машина — обнаружить эту разницу?
...Когда-то мы смеялись над корявостью и глупостью первых...
...Гладко, но безжизненно Машина пишет текст не ...
Форум приурочен к 85-летию создания Института языка, литературы и искусства им. Г. Ибрагимова Академии наук Республики Татарстан и объединяет сразу несколько научных мероприятий: Международный научно-практический семинар «Татароведение в ситуации смены научных парадигм: теория, методология, практика»; Международную научно-практическую конференцию «Национальные языки и межъязыковые процессы в современном мире»; ежегодную ...
...Форум приурочен к 85-летию создания Института...
В 2024 году Грамота выбирала слово года в несколько этапов, опираясь на три источника данных: предложения наших пользователей, статистику (запросы на портале, данные поисковых систем и нашего партнера СКАН-Интерфакс) и голосование лингвистов. В первый список кандидатов вошли многие популярные слова, в итоге не попавшие в шорт-лист. Мы решили посмотреть, как сложилась судьба самых заметных слов прошлого года: подтверждают ли новые данные наш выбор?
...В 2024 году Грамота выбирала слово года в несколько...
...Финалисты и неудачники Напомним прошлогодний...
Изучение речи русских эмигрантов свидетельствует об угасании письменной формы русского языка в среде выходцев из России, получивших образование не на русском языке. Зарубежные русские, пользующиеся русским языком как средством лишь устного общения, — это чаще всего высокообразованные эмигранты первой волны, вывезенные малолетними детьми, или их потомки, родившиеся за рубежом. У них нет навыков письменного общения на русском языке, или эти навыки очень незначительны.
...Изучение речи русских эмигрантов свидетельствует об...
...Такие люди свободно говорят и пишут на других языках...