Логотип Google Gemini — провайдер модели Google: Gemini Embedding 2

Google: Gemini Embedding 2

google/gemini-embedding-2
google
Использовать
Выпущена 20 мая 2026 г.| контекст|20,06 ₽/М вход|бесплатно/М выход

Gemini Embedding 2 is Google's first multimodal embedding model. We currently support mapping text and images into a unified vector space for semantic search and retrieval-augmented generation (RAG). It supports input context up to 8,192 tokens and flexible output dimensions from 128 to 3,072 (recommended: 768, 1536, or 3,072). Designed for cross-modal similarity — you can embed a text query and retrieve the most relevant images, or vice versa — making it well-suited for multimodal search, recommendation, and document understanding pipelines.

Провайдер для Google: Gemini Embedding 2

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

google
Контекст
токенов
Макс. ответ
Вход
20,06 ₽
за 1М токенов
Выход
бесплатно
за 1М токенов
Изображения
бесплатно
за вход

Модальности

Вход:ТекстИзображенияФайлыАудиоВидеоВыход:Эмбеддинги

Поддерживаемые параметры

max_tokensresponse_formatseedtemperaturetop_p

Другие модели от google

Google: Gemini 3.5 Flash

Gemini 3.5 Flash is Google's high-efficiency multimodal model, bringing near-Pro level coding and reasoning at Flash-tier cost and speed. It is highly optimized for coding proficiency and parallel agentic execution loops, supporting text, image, video, audio, and PDF inputs. Defaults to medium thinking effort for faster and more cost-efficient responses, with full support for thinking levels (minimal, low, medium, high) for fine-grained cost/performance trade-offs.

1.0М контекст·1,41 ₽ за /request

Google: Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite is Google’s GA high-efficiency multimodal model optimized for low-latency, high-volume workloads. It supports text, image, video, audio, and PDF inputs, and is designed for lightweight agentic workflows, simple data extraction, and applications where responsiveness and API cost are the primary constraints. Supports full thinking levels (minimal, low, medium, high) for fine-grained cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash.

1.0М контекст·1,41 ₽ за /request

Google: Gemini Embedding 2 Preview

Gemini Embedding 2 Preview — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем отображение текста и изображений в унифицированное векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуемые: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает ее хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.

контекст·от 20,06 ₽/М

Google: Gemma 4 26B A4B (free)

Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на общее количество параметров в 25,2 млрд, во время инференса на каждый токен активируется только 3,8 млрд, что обеспечивает качество, близкое к 31 млрд, при...

262К контекст·от бесплатно/М

Google: Gemma 4 26B A4B

Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на 25,2 млрд общих параметров, только 3,8 млрд активируются на каждый токен во время вывода — обеспечивая качество, близкое к 31 млрд, при значительно меньших вычислительных затратах. Поддерживает мультимодальный ввод, включая текст, изображения и видео (до 60 секунд при 1 кадре в секунду). Отличается контекстным окном в 256 тысяч токенов, нативной функцией вызова, настраиваемым режимом мышления/рассуждения и поддержкой структурированного вывода. Выпущена под лицензией Apache 2.0.

262К контекст·от 6,02 ₽/М

Google: Gemma 4 31B (free)

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 миллиардами параметров, поддерживающая ввод текста и изображений с выводом текста. Отличается контекстным окном на 256 тысяч токенов, настраиваемым режимом мышления/рассуждения, нативной функцией...

262К контекст·от бесплатно/М