К каталогу

Google: Gemma 3n 4B

google/gemma-3n-e4b-it
Использовать
Выпущена 20 мая 2025 г.|33К контекст|4,90 ₽/М вход|9,80 ₽/М выход

Gemma 3n E4B-it оптимизирована для эффективного выполнения на мобильных устройствах и устройствах с ограниченными ресурсами, таких как телефоны, ноутбуки и планшеты. Она поддерживает мультимодальные входные данные, включая текст, визуальные данные и аудио, что позволяет выполнять различные задачи, такие как генерация текста, распознавание речи, перевод и анализ изображений. Используя такие инновации, как кэширование Per-Layer Embedding (PLE) и архитектура MatFormer, Gemma 3n динамически управляет использованием памяти и вычислительной нагрузкой, выборочно активируя параметры модели, что значительно снижает требования к ресурсам во время выполнения.

Эта модель поддерживает широкий лингвистический диапазон (обучена на более чем 140 языках) и имеет гибкое контекстное окно в 32K токенов. Gemma 3n может выборочно загружать параметры, оптимизируя память и вычислительную эффективность в зависимости от задачи или возможностей устройства, что делает ее хорошо подходящей для конфиденциальных, автономных приложений и решений ИИ на устройстве. Подробнее читайте в блоге

Провайдер для Google: Gemma 3n 4B

Hubris маршрутизирует запросы через OpenRouter к лучшему доступному провайдеру с автоматическим fallback при сбоях.

Контекст
33К
токенов
Макс. ответ
Вход
4,90 ₽
за 1М токенов
Выход
9,80 ₽
за 1М токенов

Модальности

Вход:ТекстВыход:Текст

Поддерживаемые параметры

frequency_penaltylogit_biasmax_tokensmin_ppresence_penaltyrepetition_penaltystoptemperaturetop_ktop_p

Другие модели от google

Google: Gemma 4 26B A4B (free)

Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на общее количество параметров в 25,2 млрд, во время инференса на каждый токен активируется только 3,8 млрд, что обеспечивает качество, близкое к 31 млрд, при...

262К контекст·от бесплатно

Google: Gemma 4 26B A4B

Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на 25,2 млрд общих параметров, только 3,8 млрд активируются на каждый токен во время вывода — обеспечивая качество, близкое к 31 млрд, при значительно меньших вычислительных затратах. Поддерживает мультимодальный ввод, включая текст, изображения и видео (до 60 секунд при 1 кадре в секунду). Отличается контекстным окном в 256 тысяч токенов, нативной функцией вызова, настраиваемым режимом мышления/рассуждения и поддержкой структурированного вывода. Выпущена под лицензией Apache 2.0.

262К контекст·от 4,90 ₽

Google: Gemma 4 31B (free)

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 миллиардами параметров, поддерживающая ввод текста и изображений с выводом текста. Отличается контекстным окном на 256 тысяч токенов, настраиваемым режимом мышления/рассуждения, нативной функцией...

262К контекст·от бесплатно

Google: Gemma 4 31B

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 млрд параметров, поддерживающая ввод текста и изображений с выводом текста. Она имеет контекстное окно в 256 тысяч токенов, настраиваемый режим мышления/рассуждения, нативную поддержку вызова функций и многоязычную поддержку более чем на 140 языках. Модель демонстрирует высокие результаты в задачах кодирования, рассуждения и понимания документов. Лицензия Apache 2.0.

262К контекст·от 10,61 ₽

Google: Lyria 3 Pro Preview

Полные песни стоят $0.08 за песню. Lyria 3 — это семейство моделей для генерации музыки от Google, доступное через Gemini API. С помощью Lyria 3 вы можете генерировать высококачественное стерео аудио с частотой 48 кГц из текстовых запросов или изображений. Эти модели обеспечивают структурную связность, включая вокал, синхронизированные тексты песен и полные инструментальные аранжировки. Lyria 3 Pro может генерировать полноформатные песни с куплетами, припевами и бриджами.

1.0М контекст·от бесплатно

Google: Lyria 3 Clip Preview

30-секундные клипы стоят $0.04 за клип. Lyria 3 — это семейство моделей Google для генерации музыки, доступное через Gemini API. С помощью Lyria 3 вы можете генерировать высококачественное стерео аудио с частотой 48 кГц из текстовых подсказок или изображений. Эти модели обеспечивают структурную связность, включая вокал, синхронизированные тексты песен и полные инструментальные аранжировки. Lyria 3 Clip может генерировать короткие клипы, лупы, превью.

1.0М контекст·от бесплатно