Hubris
Базовые концепции

Бесплатные модели

25+ моделей с нулевой ценой — Llama, Gemma, Liquid, BGE и другие. Лимит 100 запросов в сутки на пользователя.

Бесплатные модели

В каталоге Hubris есть 25+ моделей с нулевой ценой: open-source LLM (Llama, Gemma, Liquid), embedding-модели (BGE, MiniLM, GTE) и другие. Они отмечены значком «Бесплатно» в каталоге моделей.

Бесплатные модели — это:

  • 0 ₽ за 1М токенов — ничего не списывается с баланса.
  • Доступны без депозита — даже с балансом 0 ₽ запрос проходит.
  • Лимит 100 запросов в сутки на пользователя — скользящее окно 24 ч.

Идеально подходят для:

  • Знакомства с API без оплаты.
  • Тестов и прототипов в проектах с маленьким бюджетом.
  • Embedding-задач (BGE, MiniLM, GTE — отличные модели для русского/английского текста).

Как использовать

Просто передайте ID бесплатной модели — никаких особых заголовков или флагов:

curl -s https://api.hubris.pw/v1/chat/completions \
  -H "Authorization: Bearer sk-gw-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "meta-llama/llama-3.2-3b-instruct:free",
    "messages": [{"role": "user", "content": "Привет"}]
  }'

Список бесплатных моделей в каталоге доступен через API:

curl -s 'https://api.hubris.pw/v1/models' \
  -H "Authorization: Bearer sk-gw-..." \
  | jq '.data[] | select(.pricing.input_rub_per_million == 0 and .pricing.output_rub_per_million == 0) | .id'

Что считается «бесплатной» моделью

Любая модель из каталога, у которой обе цены в pricing равны 0:

{
  "id": "meta-llama/llama-3.2-3b-instruct:free",
  "pricing": {
    "input_rub_per_million": 0,
    "output_rub_per_million": 0,
    "currency": "RUB"
  }
}

Большинство таких моделей имеют суффикс :free, но это не строгое правило — Hubris проверяет именно цены, а не имя. Если когда-нибудь модель станет платной, она автоматически перестанет считаться бесплатной.

Лимит и его правила

100 запросов на пользователя в сутки (скользящее окно 24 ч). Считаются только запросы к бесплатным моделям — платные не учитываются. При превышении возвращается 429 daily_limit_exceeded:

{
  "error": {
    "message": "Free-tier daily limit reached: 100 requests per 24h. Upgrade by using a paid model or wait for the rolling window to reset.",
    "type": "rate_limit_error",
    "code": "daily_limit_exceeded"
  }
}

Когда лимит сбросится — зависит от того, когда был сделан первый из 100 запросов: окно скользит. Через 24 часа после первого запроса один слот освобождается; и так далее.

Лимит общий для всех бесплатных моделей — нельзя «накопить» по 100 на каждой модели. Это сделано чтобы:

  1. Защитить наш общий ключ к провайдеру от 429 от него самого.
  2. Не дать ботам жечь бесплатный пул и блокировать его для реальных пользователей.

Лимит сейчас в Hubris не настраивается на стороне пользователя. Если вам нужен больше — переходите на платные модели.

Связь с лимитом ключа. Поле «Дневной лимит, ₽» на странице API-ключи считает только сумму cost_kopecks за 24 ч. Бесплатные модели стоят 0 ₽, поэтому в этот лимит не входят и не «съедают» его. Это два независимых счётчика.

Чем бесплатные отличаются от платных

ПараметрБесплатныеПлатные
Цена0 ₽По каталогу
Минимальный балансНе требуется1 ₽
Дневной лимит100 запросов / 24 чНе применяется (или ваш custom-лимит на ключе)
КачествоМелкие/средние LLMЛюбые, включая флагманы
ЛатентностьЧасто выше — провайдеры приоритезируют платныхСтандартная
SLABest-effortСоответствует провайдеру

Внимание: бесплатные модели на стороне провайдера часто rate-limited гораздо жёстче платных. Может прийти 502 от Hubris (мы транслируем upstream-error), даже если ваш дневной лимит не исчерпан. Это не баг — провайдер сам режет нас. Стратегия: сделать Model Fallback с платной моделью в конце массива.

Сочетание с Model Fallback

Хороший паттерн — дешёвая основа, платная подстраховка:

curl -s https://api.hubris.pw/v1/chat/completions \
  -H "Authorization: Bearer sk-gw-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "meta-llama/llama-3.2-3b-instruct:free",
    "models": [
      "meta-llama/llama-3.2-3b-instruct:free",
      "anthropic/claude-haiku-4.5"
    ],
    "messages": [{"role": "user", "content": "..."}]
  }'

Если бесплатная Llama упадёт от провайдерского 429 — Hubris автоматически переключится на платный Haiku. Биллится тот, кто реально ответил — то есть в большинстве случаев это будет 0 ₽, и только в редких сбоях — копейки за Haiku.

Что дальше

  • Модели — обзор каталога.
  • Model Fallback — про автоматическое переключение.
  • Цены — формула расчёта стоимости платных моделей.