Бесплатные модели
25+ моделей с нулевой ценой — Llama, Gemma, Liquid, BGE и другие. Лимит 100 запросов в сутки на пользователя.
Бесплатные модели
В каталоге Hubris есть 25+ моделей с нулевой ценой: open-source LLM (Llama, Gemma, Liquid), embedding-модели (BGE, MiniLM, GTE) и другие. Они отмечены значком «Бесплатно» в каталоге моделей.
Бесплатные модели — это:
- 0 ₽ за 1М токенов — ничего не списывается с баланса.
- Доступны без депозита — даже с балансом 0 ₽ запрос проходит.
- Лимит 100 запросов в сутки на пользователя — скользящее окно 24 ч.
Идеально подходят для:
- Знакомства с API без оплаты.
- Тестов и прототипов в проектах с маленьким бюджетом.
- Embedding-задач (BGE, MiniLM, GTE — отличные модели для русского/английского текста).
Как использовать
Просто передайте ID бесплатной модели — никаких особых заголовков или флагов:
curl -s https://api.hubris.pw/v1/chat/completions \
-H "Authorization: Bearer sk-gw-..." \
-H "Content-Type: application/json" \
-d '{
"model": "meta-llama/llama-3.2-3b-instruct:free",
"messages": [{"role": "user", "content": "Привет"}]
}'
Список бесплатных моделей в каталоге доступен через API:
curl -s 'https://api.hubris.pw/v1/models' \
-H "Authorization: Bearer sk-gw-..." \
| jq '.data[] | select(.pricing.input_rub_per_million == 0 and .pricing.output_rub_per_million == 0) | .id'
Что считается «бесплатной» моделью
Любая модель из каталога, у которой обе цены в pricing равны 0:
{
"id": "meta-llama/llama-3.2-3b-instruct:free",
"pricing": {
"input_rub_per_million": 0,
"output_rub_per_million": 0,
"currency": "RUB"
}
}
Большинство таких моделей имеют суффикс :free, но это не строгое правило — Hubris проверяет именно цены, а не имя. Если когда-нибудь модель станет платной, она автоматически перестанет считаться бесплатной.
Лимит и его правила
100 запросов на пользователя в сутки (скользящее окно 24 ч). Считаются только запросы к бесплатным моделям — платные не учитываются. При превышении возвращается 429 daily_limit_exceeded:
{
"error": {
"message": "Free-tier daily limit reached: 100 requests per 24h. Upgrade by using a paid model or wait for the rolling window to reset.",
"type": "rate_limit_error",
"code": "daily_limit_exceeded"
}
}
Когда лимит сбросится — зависит от того, когда был сделан первый из 100 запросов: окно скользит. Через 24 часа после первого запроса один слот освобождается; и так далее.
Лимит общий для всех бесплатных моделей — нельзя «накопить» по 100 на каждой модели. Это сделано чтобы:
- Защитить наш общий ключ к провайдеру от 429 от него самого.
- Не дать ботам жечь бесплатный пул и блокировать его для реальных пользователей.
Лимит сейчас в Hubris не настраивается на стороне пользователя. Если вам нужен больше — переходите на платные модели.
Связь с лимитом ключа. Поле «Дневной лимит, ₽» на странице API-ключи считает только сумму cost_kopecks за 24 ч. Бесплатные модели стоят 0 ₽, поэтому в этот лимит не входят и не «съедают» его. Это два независимых счётчика.
Чем бесплатные отличаются от платных
| Параметр | Бесплатные | Платные |
|---|---|---|
| Цена | 0 ₽ | По каталогу |
| Минимальный баланс | Не требуется | 1 ₽ |
| Дневной лимит | 100 запросов / 24 ч | Не применяется (или ваш custom-лимит на ключе) |
| Качество | Мелкие/средние LLM | Любые, включая флагманы |
| Латентность | Часто выше — провайдеры приоритезируют платных | Стандартная |
| SLA | Best-effort | Соответствует провайдеру |
Внимание: бесплатные модели на стороне провайдера часто rate-limited гораздо жёстче платных. Может прийти 502 от Hubris (мы транслируем upstream-error), даже если ваш дневной лимит не исчерпан. Это не баг — провайдер сам режет нас. Стратегия: сделать Model Fallback с платной моделью в конце массива.
Сочетание с Model Fallback
Хороший паттерн — дешёвая основа, платная подстраховка:
curl -s https://api.hubris.pw/v1/chat/completions \
-H "Authorization: Bearer sk-gw-..." \
-H "Content-Type: application/json" \
-d '{
"model": "meta-llama/llama-3.2-3b-instruct:free",
"models": [
"meta-llama/llama-3.2-3b-instruct:free",
"anthropic/claude-haiku-4.5"
],
"messages": [{"role": "user", "content": "..."}]
}'
Если бесплатная Llama упадёт от провайдерского 429 — Hubris автоматически переключится на платный Haiku. Биллится тот, кто реально ответил — то есть в большинстве случаев это будет 0 ₽, и только в редких сбоях — копейки за Haiku.
Что дальше
- Модели — обзор каталога.
- Model Fallback — про автоматическое переключение.
- Цены — формула расчёта стоимости платных моделей.