Модель | Журнал | Поиск по Грамоте

Исследование: внутренний язык больших языковых моделей ближе всего к английскому

Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...

...Языковая модель Llama-2 с открытым исходным кодом...

...Влияние этого «внутреннего» языка, который модель...

...Английская языковая картина мира может влиять на то, как модель...

Маргиналы цифрового мира: можно ли улучшить распознавание редких языков

Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...

...Модель Random Forest относительно проста и устойчива...

...к эффекту переобучения (при котором модель хорошо...

...Модель достигла впечатляющих результатов: общая точность...

Новый подход поможет людям более успешно общаться с большими языковыми моделями

Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.

...Дело в том, что языковая модель обучена на текстовых...

...соединяются в слова и предложения, потому что модель...

...Языковая модель, которая полагается на вероятность...

Чем сгенерированные тексты (пока еще) выдают себя

Когда-то мы смеялись над корявостью и глупостью первых языковых моделей. Сегодня чат-боты пишут за людей деловые письма и посты, сочиняют рассказы, ведут задушевные беседы и приводят аргументы в спорах. Есть ли что-то, чем речь машины в корне отличается от человеческой? И может ли эксперт — или даже другая машина — обнаружить эту разницу?

...Когда-то мы смеялись над корявостью и глупостью первых...

...На каждом шаге модель смотрит на контекст...

...Сначала модель генерирует много вариантов ответов....

...Модель запоминает, какие ответы нравятся людям, и ...

Сбер представил самого продвинутого чат-бота на русском языке

На международной конференции по искусственному интеллекту AI Journey разработчики Сбера анонсировали новую версию GigaChat. Это нейросеть, способная справляться со сложными задачами, в том числе развернуто отвечать на вопросы, придумывать сюжеты, переписывать и редактировать тексты. В основе новой версии лежит одна из наиболее продвинутых лингвистических моделей для русского языка, в которой учитываются 29 миллиардов параметров: их число определяет способность нейросети точно и быстро ...

...Модель новой версии GigaChat «превосходит самый...

... Кроме того, нейросетевая модель GigaChat успешно...

Язык дельфинов пробуют расшифровать с помощью искусственного интеллекта

Новая языковая модель на основе искусственного интеллекта DolphinGemma может приблизить ученых к пониманию коммуникации дельфинов. О проекте сообщает блог компании Google, которая реализует его совместно с исследователями из Технологического института Джорджии (США) и организации Wild Dolphin Project (WDP). DolphinGemma обучена на обширной базе записей звуков, которые издают атлантические пятнистые дельфины. Основная цель проекта — не только распознавать щелчки, свисты и ...

...Новая языковая модель на основе искусственного интеллекта...

...Модель DolphinGemma достаточно компактна, чтобы работать...

В Балтийском федеральном университете создали чат-бота на основе трудов Канта

Исследователи Балтийского центра нейротехнологий и искусственного интеллекта БФУ им. Канта натренировали большую языковую модель на текстах трудов Иммануила Канта. В результате, по их словам, модель научилась поддерживать диалог о философских понятиях. Пресс-служба БФУ опубликовала несколько цитат из ответов бота. Например, вот как он отреагировал на вопрос, возможна ли ложь во спасение: «Дорогой друг, я считаю, что ложь не может быть использована во спасении. Ведь ложь противоречит ...

...Канта натренировали большую языковую модель на...

...В результате, по их словам, модель научилась поддерживать...

Прогноз: текстовые данные для обучения нейросетей могут закончиться в ближайшие годы

В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...

...и Кембриджа, говорится, что введение в модель...

...должны быть сбалансированы «живыми», чтобы модель...

Компания Alibaba представила собственный ИИ-переводчик для международной торговли

Международная торговая компания Alibaba International Digital Commerce (AIDC) Group, известная как Alibaba, анонсировала запуск новой большой языковой модели Macro MT, разработанной специально для переводов в сфере международной торговли. Решение создать такой сервис в компании приняли после того, как обнаружили, что существующие инструменты перевода не учитывают в полной мере культурные особенности текстов. Модель будет встроена в системы управления ...

... Модель будет встроена в системы управления...

... Сейчас модель может работать с 15 языками...

Нейросеть научилась распознавать задуманные слова по активности мозга

Специалисты из Нью-Йоркского университета создали модель машинного обучения (нейросеть), которая анализирует электрическую активность коры головного мозга, связанную с речью, и воспроизводит задуманные человеком слова. Для обучения модели исследователи обратились к группе из пяти пациентов с диагностированной рефрактерной эпилепсией и нарушениями развития речи. В этом состоянии пациент не реагирует на лечение противоэпилептическими препаратами в адекватных дозах и комбинациях, то есть не ...

...Специалисты из Нью-Йоркского университета создали модель...

...пути их коррекции, исследователи стремятся построить модель...

Почитать на грамоте