Trinity Mini — это языковая модель с разреженной смесью экспертов (MoE) с 26 миллиардами параметров (3 миллиарда активных), включающая 128 экспертов, из которых 8 активны на каждый токен. Разработана для эффективного рассуждения в длинных контекстах (131k) с надёжным вызовом функций и многошаговыми рабочими процессами агентов.
Провайдер для Arcee AI: Trinity Mini
Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.
Модальности
Поддерживаемые параметры
Другие модели от arcee-ai
Arcee AI: Trinity Large Thinking
Trinity Large Thinking — это мощная open source модель для рассуждений от команды Arcee AI. Она демонстрирует высокую производительность в PinchBench, агентских рабочих нагрузках и задачах на рассуждение. Видео запуска: https://youtu.be/Gc82AXLa0Rg?si=4RLn6WBz33qT--B7 Эта модель оптимизирована для агентских рабочих процессов и показывает наилучшие результаты, когда рассуждения сохраняются (так называемое чередующееся мышление). Узнайте, как сохранить рассуждения, в нашей документации:
Arcee AI: Virtuoso Large
Virtuoso-Large — это флагманская универсальная LLM от Arcee с 72 миллиардами параметров, настроенная для решения задач кросс-доменного рассуждения, творческого письма и корпоративного QA. В отличие от многих 70-миллиардных аналогов, она сохраняет контекст в 128 тысяч токенов, унаследованный от Qwen 2.5, что позволяет ей обрабатывать книги, кодовые базы или финансовые отчёты целиком. Обучение включало дистилляцию DeepSeek R1, многоэпохальную контролируемую fine-tuning и финальную стадию выравнивания DPO/RLHF, что обеспечило высокую производительность в тестах BIG-Bench-Hard, GSM-8K и Needle-In-Haystack с длинным контекстом. Предприятия используют Virtuoso-Large в качестве «резервного» мозга в конвейерах Conductor, когда другие SLM показывают низкую уверенность. Несмотря на свой размер, агрессивные оптимизации KV-кэша позволяют поддерживать задержку первого токена в диапазоне нескольких секунд на узлах с 8× H100, что делает её практичным производственным решением.
Arcee AI: Coder Large
Coder-Large — это модель с 32 миллиардами параметров, разработанная на основе Qwen 2.5-Instruct, которая была дополнительно обучена на корпусах GitHub, CodeSearchNet и синтетических исправлениях ошибок с разрешительной лицензией. Она поддерживает контекстное окно в 32k токенов, что позволяет выполнять рефакторинг нескольких файлов или просматривать длинные diff за один вызов, а также понимает более 30 языков программирования с особым вниманием к TypeScript, Go и Terraform. Внутренние тесты показывают прирост в 5–8 баллов по сравнению с CodeLlama-34B-Python на HumanEval и конкурентоспособные результаты BugFix благодаря этапу усиления, который поощряет компилируемый вывод. Модель по умолчанию выдает структурированные объяснения вместе с блоками кода, что делает ее подходящей как для образовательных инструментов, так и для сценариев производственных помощников. С точки зрения стоимости, Together AI предлагает ее по цене значительно ниже проприетарных аналогов, поэтому команды могут масштабировать интерактивное кодирование без чрезмерных затрат.