Логотип Google Gemini — провайдер модели Google: Gemma 4 26B A4B  (free)

Google: Gemma 4 26B A4B (free)

google/gemma-4-26b-a4b-it:free
google
Выпущена 3 апреля 2026 г.|262К контекст|бесплатно/М вход|бесплатно/М выход

Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на общее количество параметров в 25,2 млрд, во время инференса на каждый токен активируется только 3,8 млрд, что обеспечивает качество, близкое к 31 млрд, при...

⚠ Бесплатная витрина модели

Лимиты RPM/RPD выставляет провайдер модели, не Hubris — конкретные значения провайдер не публикует. При 429 повторите запрос с экспоненциальной задержкой либо переключитесь на платную версию модели. Подробнее.

Провайдер для Google: Gemma 4 26B A4B (free)

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

google
Контекст
262К
токенов
Макс. ответ
33К
токенов
Вход
бесплатно
за 1М токенов
Выход
бесплатно
за 1М токенов

Модальности

Вход:ИзображенияТекстВидеоВыход:Текст

Поддерживаемые параметры

frequency_penaltyinclude_reasoningmax_tokenspresence_penaltyreasoningrepetition_penaltyresponse_formatseedstoptemperaturetool_choicetoolstop_ktop_p

Другие модели от google

Google: Gemini Embedding 2

Gemini Embedding 2 — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем сопоставление текста и изображений в единое векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуется: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает её хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.

контекст·от 21,22 ₽/М

Google: Gemini 3.5 Flash

Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, обеспечивающая уровень кодирования и рассуждений, близкий к Pro, при стоимости и скорости уровня Flash. Она высоко оптимизирована для навыков кодирования и параллельных агентных циклов выполнения, поддерживая ввод текста, изображений, видео, аудио и PDF. По умолчанию используется средний уровень мыслительных усилий для более быстрых и экономичных ответов, с полной поддержкой уровней мышления (минимальный, низкий, средний, высокий) для точной настройки компромиссов между стоимостью и производительностью.

1.0М контекст·от 159,16 ₽/М

Google: Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google, оптимизированная для рабочих нагрузок с низкой задержкой и большим объемом. Она поддерживает ввод текста, изображений, видео, аудио и PDF-файлов, а также предназначена для легковесных агентских рабочих процессов, простого извлечения данных и приложений, где основными ограничениями являются скорость отклика и стоимость API. Поддерживает полные уровни мышления (минимальный, низкий, средний, высокий) для точной настройки соотношения затрат и производительности.

1.0М контекст·от 26,53 ₽/М

Google Gemini Pro Latest

Эта модель всегда перенаправляет на последнюю модель семейства Google Gemini Pro.

1.0М контекст·от 212,21 ₽/М

Google Gemini Flash Latest

Эта модель всегда перенаправляет на последнюю модель из семейства Google Gemini Flash.

1.0М контекст·от 159,16 ₽/М

Google: Gemini Embedding 2 Preview

Gemini Embedding 2 Preview — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем отображение текста и изображений в унифицированное векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуемые: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает ее хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.

контекст·от 21,22 ₽/М