Логотип Arcee AI — провайдер модели Arcee AI: Trinity Mini

Arcee AI: Trinity Mini

arcee-ai/trinity-mini
arcee-ai
Выпущена 1 декабря 2025 г.|131К контекст|4,77 ₽/М вход|15,92 ₽/М выход

Trinity Mini — это языковая модель с разреженной смесью экспертов (MoE) с 26 миллиардами параметров (3 миллиарда активных), включающая 128 экспертов, из которых 8 активны на каждый токен. Разработана для эффективного рассуждения в длинных контекстах (131k) с надёжным вызовом функций и многошаговыми рабочими процессами агентов.

Провайдер для Arcee AI: Trinity Mini

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

arcee-ai
Контекст
131К
токенов
Макс. ответ
131К
токенов
Вход
4,77 ₽
за 1М токенов
Выход
15,92 ₽
за 1М токенов

Модальности

Вход:ТекстВыход:Текст

Поддерживаемые параметры

include_reasoningmax_completion_tokensmax_tokensreasoningresponse_formatstopstructured_outputstemperaturetool_choicetoolstop_p

Другие модели от arcee-ai

Arcee AI: Trinity Large Thinking

Trinity Large Thinking — это мощная open source модель для рассуждений от команды Arcee AI. Она демонстрирует высокую производительность в PinchBench, агентских рабочих нагрузках и задачах на рассуждение. Видео запуска: https://youtu.be/Gc82AXLa0Rg?si=4RLn6WBz33qT--B7 Эта модель оптимизирована для агентских рабочих процессов и показывает наилучшие результаты, когда рассуждения сохраняются (так называемое чередующееся мышление). Узнайте, как сохранить рассуждения, в нашей документации:

262К контекст·от 23,34 ₽/М

Arcee AI: Virtuoso Large

Virtuoso-Large — это флагманская универсальная LLM от Arcee с 72 миллиардами параметров, настроенная для решения задач кросс-доменного рассуждения, творческого письма и корпоративного QA. В отличие от многих 70-миллиардных аналогов, она сохраняет контекст в 128 тысяч токенов, унаследованный от Qwen 2.5, что позволяет ей обрабатывать книги, кодовые базы или финансовые отчёты целиком. Обучение включало дистилляцию DeepSeek R1, многоэпохальную контролируемую fine-tuning и финальную стадию выравнивания DPO/RLHF, что обеспечило высокую производительность в тестах BIG-Bench-Hard, GSM-8K и Needle-In-Haystack с длинным контекстом. Предприятия используют Virtuoso-Large в качестве «резервного» мозга в конвейерах Conductor, когда другие SLM показывают низкую уверенность. Несмотря на свой размер, агрессивные оптимизации KV-кэша позволяют поддерживать задержку первого токена в диапазоне нескольких секунд на узлах с 8× H100, что делает её практичным производственным решением.

131К контекст·от 79,58 ₽/М

Arcee AI: Coder Large

Coder-Large — это модель с 32 миллиардами параметров, разработанная на основе Qwen 2.5-Instruct, которая была дополнительно обучена на корпусах GitHub, CodeSearchNet и синтетических исправлениях ошибок с разрешительной лицензией. Она поддерживает контекстное окно в 32k токенов, что позволяет выполнять рефакторинг нескольких файлов или просматривать длинные diff за один вызов, а также понимает более 30 языков программирования с особым вниманием к TypeScript, Go и Terraform. Внутренние тесты показывают прирост в 5–8 баллов по сравнению с CodeLlama-34B-Python на HumanEval и конкурентоспособные результаты BugFix благодаря этапу усиления, который поощряет компилируемый вывод. Модель по умолчанию выдает структурированные объяснения вместе с блоками кода, что делает ее подходящей как для образовательных инструментов, так и для сценариев производственных помощников. С точки зрения стоимости, Together AI предлагает ее по цене значительно ниже проприетарных аналогов, поэтому команды могут масштабировать интерактивное кодирование без чрезмерных затрат.

33К контекст·от 53,05 ₽/М