hubris
Логотип Google Gemini — провайдер модели Google: Gemma 3n 4B

Google: Gemma 3n 4B

google/gemma-3n-e4b-it
google
Выпущена 20 мая 2025 г.|33К контекст|6,44 ₽/М вход|12,87 ₽/М выход

Gemma 3n E4B-it оптимизирована для эффективного выполнения на мобильных устройствах и устройствах с ограниченными ресурсами, таких как телефоны, ноутбуки и планшеты. Она поддерживает мультимодальные входные данные, включая текст, визуальные данные и аудио, что позволяет выполнять различные задачи, такие как генерация текста, распознавание речи, перевод и анализ изображений. Используя такие инновации, как кэширование Per-Layer Embedding (PLE) и архитектура MatFormer, Gemma 3n динамически управляет использованием памяти и вычислительной нагрузкой, выборочно активируя параметры модели, что значительно снижает требования к ресурсам во время выполнения.

Эта модель поддерживает широкий лингвистический диапазон (обучена на более чем 140 языках) и имеет гибкое контекстное окно в 32K токенов. Gemma 3n может выборочно загружать параметры, оптимизируя память и вычислительную эффективность в зависимости от задачи или возможностей устройства, что делает ее хорошо подходящей для конфиденциальных, автономных приложений и решений ИИ на устройстве. Подробнее читайте в блоге

Провайдер для Google: Gemma 3n 4B

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

google
Контекст
33К
токенов
Макс. ответ
Вход
6,44 ₽
за 1М токенов
Выход
12,87 ₽
за 1М токенов

Модальности

Вход:ТекстВыход:Текст

Поддерживаемые параметры

frequency_penaltylogit_biasmax_tokensmin_ppresence_penaltyrepetition_penaltyresponse_formatstopstructured_outputstemperaturetop_ktop_p

Другие модели от google

Google: Nano Banana 2 (Gemini 3.1 Flash Image)

Gemini 3.1 Flash Image, также известный как "Nano Banana 2", — это новейшая передовая модель Google для генерации и редактирования изображений, обеспечивающая визуальное качество профессионального уровня на скорости Flash. Она сочетает в себе расширенное контекстное понимание с быстрым и экономичным выводом, делая сложную генерацию изображений и итеративное редактирование значительно более доступными. Соотношение сторон можно контролировать с помощью параметра image_config API.

131К контекст·от 53,64 ₽/М

Google: Nano Banana Pro (Gemini 3 Pro Image)

Nano Banana Pro — это самая передовая модель Google для генерации и редактирования изображений, построенная на базе Gemini 3 Pro. Она расширяет возможности оригинальной Nano Banana за счет значительно улучшенного мультимодального мышления, привязки к реальному миру и высококачественного визуального синтеза. Модель генерирует контекстно-обогащенную графику, от инфографики и диаграмм до кинематографических композиций, и может включать информацию в реальном времени посредством привязки к Поиску. Она предлагает лучшее в отрасли отображение текста на изображениях (включая длинные отрывки и многоязычные макеты), последовательное смешивание нескольких изображений и точное сохранение идентичности до пяти объектов. Nano Banana Pro добавляет детальные творческие элементы управления, такие как локализованное редактирование, настройка освещения и фокуса, преобразования камеры, а также поддержку вывода 2K/4K и гибких соотношений сторон. Она разработана для профессионального дизайна, визуализации продуктов, раскадровки и сложных многоэлементных композиций, оставаясь при этом эффективной для общих рабочих процессов создания изображений.

66К контекст·от 214,54 ₽/М

Google: Gemini Embedding 2

Gemini Embedding 2 — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем сопоставление текста и изображений в единое векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуется: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает её хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.

контекст·от 21,45 ₽/М

Google: Gemini 3.5 Flash

Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, обеспечивающая уровень кодирования и рассуждений, близкий к Pro, при стоимости и скорости уровня Flash. Она высоко оптимизирована для навыков кодирования и параллельных агентных циклов выполнения, поддерживая ввод текста, изображений, видео, аудио и PDF. По умолчанию используется средний уровень мыслительных усилий для более быстрых и экономичных ответов, с полной поддержкой уровней мышления (минимальный, низкий, средний, высокий) для точной настройки компромиссов между стоимостью и производительностью.

1.0М контекст·от 160,91 ₽/М

Google: Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google, оптимизированная для рабочих нагрузок с низкой задержкой и большим объемом. Она поддерживает ввод текста, изображений, видео, аудио и PDF-файлов, а также предназначена для легковесных агентских рабочих процессов, простого извлечения данных и приложений, где основными ограничениями являются скорость отклика и стоимость API. Поддерживает полные уровни мышления (минимальный, низкий, средний, высокий) для точной настройки соотношения затрат и производительности.

1.0М контекст·от 26,82 ₽/М

Google Gemini Pro Latest

Эта модель всегда перенаправляет на последнюю модель семейства Google Gemini Pro.

1.0М контекст·от 214,54 ₽/М