Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
Чем отличаются диалект, говор и наречие, можно ли считать носителя говора неграмотным, нужно ли избавляться от говора, какой из русских диалектов ближе к древнерусскому языку — об этом рассказал в большом интервью онлайн-изданию «Т—Ж» член-корреспондент РАН, профессор факультета антропологии Европейского университета Николай Вахтин.
...Чем отличаются диалект, говор и наречие, можно...
...Диалект, говор и наречие привязаны к определенной...
В журнале «Неофилология» вышла статья филологов Ольги Ребковец и Натальи Милянчук о том, как изменилась система жанров научно-популярного изложения в связи с развитием технологий. Авторы рассматривают, какую цель преследует тот или иной текст и какие коммуникативные позиции занимают автор и адресат.
...В журнале «Неофилология» вышла статья...
...С начала XXI века объем текстов в научно-популярном...
В список нынешнего года вошли существительные лимб, проявленность, зумер, ред-флаг, сигма, имба, выгорание, промпт, слоп, брейнрот, а также междометие пупупу и глагол подсветить. Лингвисты рассмотрели более 500 слов, из которых 63 соответствовали основным критериям: недавнее появление в языке или развитие нового значения в последние несколько лет; заметный рост упоминаемости в социальных сетях, в онлайн-СМИ и на интернет-страницах в 2025 году, а ...
...В список нынешнего года вошли существительные...
Эвфемизмы, или слова-заместители, мы употребляем в тех случаях, когда слово, которое напрашивается в этом контексте, считается непристойным, оскорбительным или неуместным по каким-то другим причинам. И такие «мягкие» формулировки появляются не только на месте ругательств — эвфемизмами заменяют и многие другие лексические единицы. Для каких групп слов они используются чаще всего? Попробуем показать отдельные фрагменты этой большой картины.
...Эвфемизмы, или слова-заместители, мы употребляем в&...
...Не думать об опасном Слово эвфемизм происходит от...
В этом году наш портал впервые провел собственную акцию «Слово года». Присоединяясь к этому тренду, Грамота ставит перед собой задачу зафиксировать и проанализировать процессы, которые происходили в течение года в русской лексике, как с точки зрения чисто лингвистических новаций и трендов, так и с точки зрения отражения в лексике общественных настроений и образа жизни носителей русского языка. Выбор слова 2023 года был сделан на основе нескольких критериев: анализа ...
...В этом году наш портал впервые провел собственную акцию...
Сервис управления соцсетями LiveDune совместно с СПбГУ провел масштабное исследование современного российского интернет-сленга. Набор данных включал 56 млн комментариев, оставленных в самых популярных в России социальных сетях. Выявлением сленга занималась нейросеть «Ольга Станиславовна», созданная командой LiveDune специально для оценки тональности соцсетевого контента. Авторы проанализировали частотность использования сленговых слов и составили рейтинг самых распространенных.
...Сервис управления соцсетями LiveDune совместно с СПбГУ...
Генеративные нейросетевые модели уже используются в научных текстах, и это не новость. Но насколько активно ученые прибегают к таким инструментам — хотя бы на уровне создания аннотаций к своим статьям? Группа ученых из Германии и США проанализировала более 15 млн англоязычных аннотаций биомедицинских статей из базы PubMed с 2010 по 2024 год. Их интересовали статистически измеримые перемены в
...Генеративные нейросетевые модели уже используются в...
Мы с несколькими коллегами работаем над новым двуязычным русско-немецким и немецко-многоязычным (в том числе русским) онлайн-словарем синтаксических фразеологизмов. В течение следующего года мы планируем достичь объема триста словарных статей по каждому из двух языков и опубликовать первую версию словаря, но будем продолжать над ним работать и его пополнять.
...Мы с несколькими коллегами работаем над новым двуязычным...
...Синтаксические фразеологизмы-конструкции представляют...