«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
О характерных чертах языка нейросетей и перспективах его влияния на наши речевые привычки изданию «Социодиггер» рассказал доцент НИУ ВШЭ, старший научный сотрудник ИРЛИ РАН Борис Орехов.
...О характерных чертах языка нейросетей и перспективах...
...Многие восхищаются тем, как хорошо нейросети научились...
Перевести набоковские образы часто невозможно не только на другой язык, но и интермедийно: как должно быть визуально представлено то, что может воплощаться только в слове? Этим вопросом задались лингвисты Любовь Каракуц-Бородина и Борис Орехов.
...Перевести набоковские образы часто невозможно не только...
...Они подготовили выставку для Музея Владимира Набокова...
Отчего безропотное принятие смерти от рук убийц, подосланных нечестивцем, который захватил киевский престол, стало причиной канонизации братьев и прославило их в веках? Что такое «удвоенная» святость и греховная «двойственность»? И почему настоящим прародителем Святополка, рожденного, согласно автору жития, от двух отцов, на самом деле был третий отец — дьявол? «Горький» продолжает публикацию статей Андрея Ранчина из цикла «Как читать древнерусскую литературу».
...Отчего безропотное принятие смерти от рук убийц, подосланных...
...Князья-братья Борис и Глеб — одни из самых почитаемых...
Нейросети уже неплохо справляются с анализом и порождением текстов, они умеют многое из того, что раньше делали только люди. Какие возможности это дает? Участники круглого стола «Ай да AI. Нейросети и создание текстов: проблемы и перспективы генеративных моделей» обсудили, чем ИИ может помочь в научной работе и какие навыки понадобятся людям в цифровую эпоху. Грамота записала самое главное.
...Нейросети уже неплохо справляются с анализом и...
...В дискуссии на Костомаровском форуме участвовали руководитель...
День русского языка традиционно отмечается в день рождения Александра Сергеевича Пушкина. В пресс-конференции участвуют: — член Совета при Президенте Российской Федерации по русскому языку Константин Деревянко; — и. о. ректора Государственного института русского языка им. А. С. Пушкина Наталья Трухановская; — доцент Школы лингвистики НИУ ВШЭ, старший научный сотрудник Института русской литературы (Пушкинского дома) РАН Борис Орехов; — главный редактор ...
...День русского языка традиционно отмечается в день рождения...
Включение интернет-сленга в авторитетные лексикографические издания отражает процесс естественной эволюции языка под влиянием цифровых платформ. Недавний пример — обновление словника Кембриджского словаря, в который вошли понятия из интернет-культуры последних лет. Skibidi — слово, которое может иметь различные значения, такие как «крутой» или «плохой», либо использоваться в качестве шутки. Термин приобрел популярность благодаря вирусному анимационному ...
...Включение интернет-сленга в авторитетные лексикографические...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...