Журнал
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Дело в том, что языковая модель обучена на текстовых...
...Языковая модель, которая полагается на вероятность...
Новая языковая модель на основе искусственного интеллекта DolphinGemma может приблизить ученых к пониманию коммуникации дельфинов. О проекте сообщает блог компании Google, которая реализует его совместно с исследователями из Технологического института Джорджии (США) и организации Wild Dolphin Project (WDP). DolphinGemma обучена на обширной базе записей звуков, которые издают атлантические пятнистые дельфины. Основная цель проекта — не только распознавать щелчки, свисты и ...
...Новая языковая модель на основе искусственного интеллекта...
Зоны мозга, связанные с обработкой речи, почти не «подают голос», когда мы читаем грамматически простые и понятные предложения. Однако их активность возрастает, когда мы продираемся сквозь сложный текст. Но насколько сложным он должен быть? Исследователи из Массачусетского технологического института решили проверить, как речевые зоны реагируют на фразы разной сложности. Для начала они выбрали 1000 предложений из художественной литературы, расшифровок устной речи, текстов ...
...новое предложение, основываясь на том, как большая языковая...
...модель отреагировала на эти 1000 предложений....
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...для слов и словосочетаний нейросеть, большая языковая...
...модель и машинное обучение можно подобрать обобщающий...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Языковая модель Llama-2 с открытым исходным кодом...