Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 миллиардами параметров, поддерживающая ввод текста и изображений с выводом текста. Отличается контекстным окном на 256 тысяч токенов, настраиваемым режимом мышления/рассуждения, нативной функцией...
⚠ Бесплатная витрина модели
Лимиты RPM/RPD выставляет провайдер модели, не Hubris — конкретные значения провайдер не публикует. При 429 повторите запрос с экспоненциальной задержкой либо переключитесь на платную версию модели. Подробнее.
Провайдер для Google: Gemma 4 31B (free)
Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.
Модальности
Поддерживаемые параметры
Другие модели от google
Google: Gemini Embedding 2
Gemini Embedding 2 — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем сопоставление текста и изображений в единое векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуется: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает её хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.
Google: Gemini 3.5 Flash
Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, обеспечивающая уровень кодирования и рассуждений, близкий к Pro, при стоимости и скорости уровня Flash. Она высоко оптимизирована для навыков кодирования и параллельных агентных циклов выполнения, поддерживая ввод текста, изображений, видео, аудио и PDF. По умолчанию используется средний уровень мыслительных усилий для более быстрых и экономичных ответов, с полной поддержкой уровней мышления (минимальный, низкий, средний, высокий) для точной настройки компромиссов между стоимостью и производительностью.
Google: Gemini 3.1 Flash Lite
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google, оптимизированная для рабочих нагрузок с низкой задержкой и большим объемом. Она поддерживает ввод текста, изображений, видео, аудио и PDF-файлов, а также предназначена для легковесных агентских рабочих процессов, простого извлечения данных и приложений, где основными ограничениями являются скорость отклика и стоимость API. Поддерживает полные уровни мышления (минимальный, низкий, средний, высокий) для точной настройки соотношения затрат и производительности.
Google Gemini Pro Latest
Эта модель всегда перенаправляет на последнюю модель семейства Google Gemini Pro.
Google Gemini Flash Latest
Эта модель всегда перенаправляет на последнюю модель из семейства Google Gemini Flash.
Google: Gemini Embedding 2 Preview
Gemini Embedding 2 Preview — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем отображение текста и изображений в унифицированное векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуемые: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает ее хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.