Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
«Я клянусь говорить по-русски». Плакат с такой надписью, сделанной разноцветными фломастерами, можно увидеть в средней школе города Александрии в американском штате Вирджиния. Летом здесь прошли курсы русского языка для школьников и преподавателей РКИ. На них побывала филолог, журналист Ксения Туркова. В интервью нашему порталу она рассказала о том, почему американские школьники стремятся изучать русский язык, знают ли в США Грамоту и как борщи и павловопосадские платки помогают заговорить на языке Толстого и Чехова.
...«Я клянусь говорить по-русски». Плакат...
...«Ты крутая, если знаешь русский язык»...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В последнее время искусственный интеллект далеко...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
В течение первого года жизни нейропластичность максимальна: в это время формируется больше всего новых нейронов и связей между ними. Исследователи давно предполагали, что с самого раннего возраста мозг младенцев, родившихся в монолингвальных и билингвальных семьях, работает по-разному в том, что касается обработки речи. Однако ограничения в технологиях не позволяли понять, что происходит непосредственно в мозге, когда ребенок слышит речь. Группа ...
...В течение первого года жизни нейропластичность...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
22 мая в Институте Пушкина откроется Костомаровский форум. Это одно из самых масштабных ежегодных мероприятий, посвященных русскому языку. Даты его проведения традиционно приурочены к Дню славянской письменности и культуры. В рамках форума запланированы дискуссии, посвященные проблемам русского языка и его роли в общественной жизни России и зарубежных стран, трансформации языка в новых условиях технологического прорыва последних десятилетий.
...22 мая в Институте Пушкина откроется ...
Сериал «Слово пацана», который активно обсуждают уже почти два месяца, заинтересовал нас не только словом «чушпан», которое даже называли в качестве кандидата на роль слова года. Насколько точно на экране передан сленг улицы в целом? Грамота поговорила об этом Шамилем Идиатуллиным, который в 1980-е годы жил в городе Брежнев (ныне Набережные Челны) и написал об этом времени книгу.
...Сериал «Слово пацана», который активно...
...В «Слове пацана» есть хорошая фактическая...
Сколько слов существует в русском языке? Ответ на этот вопрос и сложен, и прост. Трудно назвать точную цифру, и на это есть несколько причин: язык постоянно развивается, обновляется (одни слова появляются в речи, другие исчезают, уходят); масса диалектных слов пока учеными просто не зафиксирована и ни в каких словарях не описана; почти все профессии и научные дисциплины обладают «собственными» лексиконами, которые не входят в общенародную литературную речь; есть и другие причины.
...Сколько слов существует в русском языке? Ответ на этот...
...Мир слов воистину огромен, безбрежен. Лексическое ядро...
Инструкции, законы, юридические договоры, профессиональные статьи чаще всего написаны специфическим языком. Хотя мы принимаем это как должное, исследования показывают: такая практика вредит экономике и обществу в целом.
...Инструкции, законы, юридические договоры, профессиональные...
...Все мы при решении рабочих вопросов, чтении новостей...