ERNIE-4.5-VL-424B-A47B — это мультимодальная модель Mixture-of-Experts (MoE) из серии ERNIE 4.5 от Baidu, имеющая 424 миллиарда общих параметров, из которых 47 миллиардов активны на каждый токен. Она обучена совместно на текстовых и графических данных с использованием гетерогенной архитектуры MoE и маршрутизации, изолированной по модальностям, для обеспечения высокоточной кросс-модальной аргументации, понимания изображений и генерации длинного контекста (до 131 тысячи токенов). Доработанная с помощью таких методов, как SFT, DPO, UPO и RLVR, эта модель поддерживает как «мыслящие», так и немыслящие режимы вывода. Разработанная для задач «зрение-язык» на английском и китайском языках, она оптимизирована для эффективного масштабирования и может работать с 4-битным/8-битным квантованием.
Провайдер для Baidu: ERNIE 4.5 VL 424B A47B
Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.