Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Когда язык заимствует новое слово, его правописание и произношение не всегда очевидно и может варьироваться: например, нон-фикшен и нонфикшн, фэнтези и фентези… Мы составили список «проблемных» слов, которые часто ищут на Грамоте, чтобы напомнить, какова для них текущая орфографическая норма. И попробовали выявить закономерности или хотя бы подсказки, которые помогают предвидеть, как поведет себя заимствованное слово в русском языке.
...Когда язык заимствует новое слово, его правописание...
...1. Шорт-лист В чем сложность: раздельно, слитно или...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
37% участников опроса Фонда «Общественное мнение» (ФОМ) согласны с тем, что иностранные языки преподаются в большинстве общеобразовательных школ скорее плохо. У 35% нареканий нет, еще 28% затруднились с ответом. Опрос показал, что три четверти россиян (76%) не считают владение иностранными языками необходимым навыком. Больше всего разделяющих эту мысль среди опрошенных старше 60 лет (87%), а меньше всего — среди молодежи до
...37% участников опроса Фонда «Общественное мнение...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
Написание и редактура текстов, работа с информацией и с аудиторией перестали быть уделом избранных, навыки и знания, необходимые для этого, сейчас нужны каждому. Но если интерес к русскому языку объединяет представителей разных поколений, представления о норме и стиле у них могут отличаться. Мы собрали несколько каналов на любой вкус — интересных и иногда неожиданных. Есть из чего выбрать то, что понравится и принесет пользу.
...Написание и редактура текстов, работа с информацией...
...1. Лингвист 126,2 тыс. подписчиков. «...
Генеративные нейросетевые модели уже используются в научных текстах, и это не новость. Но насколько активно ученые прибегают к таким инструментам — хотя бы на уровне создания аннотаций к своим статьям? Группа ученых из Германии и США проанализировала более 15 млн англоязычных аннотаций биомедицинских статей из базы PubMed с 2010 по 2024 год. Их интересовали статистически измеримые перемены в
...Генеративные нейросетевые модели уже используются в...
О том, какие пунктуационные и орфографические «вызовы» требуют решения, ведущая программы Ольга Северская поговорила с членом Орфографической комиссии РАН, доцентом кафедры русского языка МАрхИ и преподавателем НИУ ВШЭ Марией Ровинской.
...О том, какие пунктуационные и орфографические...
...Мы привыкли оценивать грамотность человека в основном...
Нейросети уже неплохо справляются с анализом и порождением текстов, они умеют многое из того, что раньше делали только люди. Какие возможности это дает? Участники круглого стола «Ай да AI. Нейросети и создание текстов: проблемы и перспективы генеративных моделей» обсудили, чем ИИ может помочь в научной работе и какие навыки понадобятся людям в цифровую эпоху. Грамота записала самое главное.
...Нейросети уже неплохо справляются с анализом и...
...В дискуссии на Костомаровском форуме участвовали руководитель...
Наши представления о Древней Руси во многом сформированы «Повестью временных лет», которая не всегда может служить достоверным историческим источником. Споры о роли скандинавов в создании древнерусского государства продолжались веками. Недостаток источников создал почву для развития псевдоисторических идей и любительской лингвистики. Но того, что известно исследователям, достаточно, чтобы проследить судьбу важных русских корней рус- и рос-.
...Наши представления о Древней Руси во многом сформированы...
...Этимология: фантазии и факты Наверняка многие слышали...