Arcee AI: Trinity Mini

arcee-ai/trinity-mini

Выпущена 1 декабря 2025 г.|131К контекст|4,77 ₽/М вход|15,92 ₽/М выход

Trinity Mini — это языковая модель с разреженной смесью экспертов (MoE) с 26 миллиардами параметров (3 миллиарда активных), включающая 128 экспертов, из которых 8 активны на каждый токен. Разработана для эффективного рассуждения в длинных контекстах (131k) с надёжным вызовом функций и многошаговыми рабочими процессами агентов.

Провайдер для Arcee AI: Trinity Mini

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

arcee-ai

Latency

—

Throughput

—

Uptime

—

Контекст

131К

токенов

Макс. ответ

131К

токенов

Вход

4,77 ₽

за 1М токенов

Выход

15,92 ₽

за 1М токенов

Модальности

Вход:ТекстВыход:Текст

Поддерживаемые параметры

include_reasoningmax_completion_tokensmax_tokensreasoningresponse_formatstopstructured_outputstemperaturetool_choicetoolstop_p

Тарификация для Arcee AI: Trinity Mini

Цены в рублях за 1 млн токенов. Списание — за реальные токены, без подписок.

Тип	Цена в ₽	Единица
Вход	4,77 ₽	за 1М токенов
Выход	15,92 ₽	за 1М токенов

Пример кода и API для Arcee AI: Trinity Mini

Hubris — OpenAI-совместимый API. Используйте любой OpenAI SDK, поменяв только base URL и ключ.

Получить API-ключ

curl https://api.hubris.pw/v1/chat/completions \
  -H "Authorization: Bearer sk-gw-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "arcee-ai/trinity-mini",
    "messages": [{"role": "user", "content": "Привет"}]
  }'

curl https://api.hubris.pw/v1/chat/completions \  -H "Authorization: Bearer sk-gw-..." \  -H "Content-Type: application/json" \  -d '{    "model": "arcee-ai/trinity-mini",    "messages": [{"role": "user", "content": "Привет"}]  }'

from openai import OpenAI

client = OpenAI(
    base_url="https://api.hubris.pw/v1",
    api_key="sk-gw-...",
)

response = client.chat.completions.create(
    model="arcee-ai/trinity-mini",
    messages=[{"role": "user", "content": "Привет"}],
)
print(response.choices[0].message.content)

from openai import OpenAIclient = OpenAI(    base_url="https://api.hubris.pw/v1",    api_key="sk-gw-...",)response = client.chat.completions.create(    model="arcee-ai/trinity-mini",    messages=[{"role": "user", "content": "Привет"}],)print(response.choices[0].message.content)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.hubris.pw/v1",
  apiKey: process.env.HUBRIS_API_KEY!,
});

const response = await client.chat.completions.create({
  model: "arcee-ai/trinity-mini",
  messages: [{ role: "user", content: "Привет" }],
});

console.log(response.choices[0].message.content);

import OpenAI from "openai";const client = new OpenAI({  baseURL: "https://api.hubris.pw/v1",  apiKey: process.env.HUBRIS_API_KEY!,});const response = await client.chat.completions.create({  model: "arcee-ai/trinity-mini",  messages: [{ role: "user", content: "Привет" }],});console.log(response.choices[0].message.content);

Другие модели от arcee-ai

Arcee AI: Trinity Large Thinking

Trinity Large Thinking — это мощная open source модель для рассуждений от команды Arcee AI. Она демонстрирует высокую производительность в PinchBench, агентских рабочих нагрузках и задачах на рассуждение. Видео запуска: https://youtu.be/Gc82AXLa0Rg?si=4RLn6WBz33qT--B7 Эта модель оптимизирована для агентских рабочих процессов и показывает наилучшие результаты, когда рассуждения сохраняются (так называемое чередующееся мышление). Узнайте, как сохранить рассуждения, в нашей документации:

262К контекст·от 23,34 ₽/М

Arcee AI: Virtuoso Large

Virtuoso-Large — это флагманская универсальная LLM от Arcee с 72 миллиардами параметров, настроенная для решения задач кросс-доменного рассуждения, творческого письма и корпоративного QA. В отличие от многих 70-миллиардных аналогов, она сохраняет контекст в 128 тысяч токенов, унаследованный от Qwen 2.5, что позволяет ей обрабатывать книги, кодовые базы или финансовые отчёты целиком. Обучение включало дистилляцию DeepSeek R1, многоэпохальную контролируемую fine-tuning и финальную стадию выравнивания DPO/RLHF, что обеспечило высокую производительность в тестах BIG-Bench-Hard, GSM-8K и Needle-In-Haystack с длинным контекстом. Предприятия используют Virtuoso-Large в качестве «резервного» мозга в конвейерах Conductor, когда другие SLM показывают низкую уверенность. Несмотря на свой размер, агрессивные оптимизации KV-кэша позволяют поддерживать задержку первого токена в диапазоне нескольких секунд на узлах с 8× H100, что делает её практичным производственным решением.

131К контекст·от 79,58 ₽/М

Arcee AI: Coder Large

Coder-Large — это модель с 32 миллиардами параметров, разработанная на основе Qwen 2.5-Instruct, которая была дополнительно обучена на корпусах GitHub, CodeSearchNet и синтетических исправлениях ошибок с разрешительной лицензией. Она поддерживает контекстное окно в 32k токенов, что позволяет выполнять рефакторинг нескольких файлов или просматривать длинные diff за один вызов, а также понимает более 30 языков программирования с особым вниманием к TypeScript, Go и Terraform. Внутренние тесты показывают прирост в 5–8 баллов по сравнению с CodeLlama-34B-Python на HumanEval и конкурентоспособные результаты BugFix благодаря этапу усиления, который поощряет компилируемый вывод. Модель по умолчанию выдает структурированные объяснения вместе с блоками кода, что делает ее подходящей как для образовательных инструментов, так и для сценариев производственных помощников. С точки зрения стоимости, Together AI предлагает ее по цене значительно ниже проприетарных аналогов, поэтому команды могут масштабировать интерактивное кодирование без чрезмерных затрат.

33К контекст·от 53,05 ₽/М