Перед Новым годом всех традиционно интересуют темы, связанные с этим праздником. Справочная служба уже неоднократно разрешала сомнения пользователей по поводу прописных букв и речевых формул, в чем можно убедиться, поискав словосочетание «новый год». Но зимние вопросы не иссякают: нас спрашивали о названиях в китайском зодиаке, о происхождении слов «леденец» и «сосулька» и о том, как точнее описать процесс изготовления имбирного печенья.
...Перед Новым годом всех традиционно интересуют темы,...
...Прописная или строчная Вопрос: Если к Деду Морозу...
2023 год стал вызовом для наук о языке во всем мире. Оказалось, что большие языковые модели (самый известный их представитель — ChatGPT) гораздо лучше справляются с порождением осмысленных высказываний и текстов, чем модели, которые предлагались до этого внутри лингвистики. В результате мнения специалистов о новых технологических достижениях разделились: одни их игнорируют или оспаривают их результаты, другие пытаются концептуально осмыслить и даже ...
...2023 год стал вызовом для наук о языке во...
В июне наша справочная служба побила все рекорды и ответила на 865 вопросов пользователей! Из них мы выбрали четыре, чтобы рассказать об одном из проявлений игровой природы языка, напомнить правила написания названий некоторых редакторских профессий и разобраться с дробными числительными и существительными, которыми они управляют.
...В июне наша справочная служба побила все рекорды и&...
...Управление Вопросы: 1. Как правильно следует...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Современные генеративные модели, такие как ChatGPT,...
Определенные цвета вызывают у нас устойчивые ассоциации: красный — горячий, синий — холодный, и т. д. Эти связи часто формируются на основе визуального опыта. Красный — это цвет пламени, тлеющих углей, закатного солнца; синий, голубой ассоциируются с холодом льда, водной гладью, ночной прохладой. Но могут ли такие же ассоциации возникнуть у тех, кто никогда не видел ни неба, ни солнца, ни пламени? Оказывается — да, и происходит это благодаря ...
...Определенные цвета вызывают у нас устойчивые ассоциации...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Русский драматург Александр Николаевич Островский был большим любителем народного слова и с интересом собирал незнакомые ему слова и выражения. Результатом его наблюдений за живой речью стали «Материалы для словаря русского народного языка». В 1993 году вышел основанный на этих материалах «Словарь к пьесам А. Н. Островского», который содержит историко-бытовой, историко-театральный и филологический комментарии. Борис Самойлович Шварцкопф подробно описал этот словарь нового типа в 1973 году, за двадцать лет до того, как он был опубликован.
...Русский драматург Александр Николаевич Островский был...
...В научной библиотеке Всероссийского театрального общества...
Революция нейросетей началась с текста. Но в будущем, вероятно, его роль как носителя знаний будет уменьшаться. На смену ему придут текстографические форматы, и это позволит людям быстрее понимать задачи и достигать взаимопонимания. Об этом в интервью Грамоте размышляет специалист по цифровой гуманитаристике, доктор физико-математических наук Константин Воронцов.
...Революция нейросетей началась с текста. Но в ...
...Грамота: В 2024 году Нобелевскую премию по...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...