Google: Gemini Embedding 2

google/gemini-embedding-2

Выпущена 20 мая 2026 г.|8К контекст|22,41 ₽/М вход|бесплатно/М выход

Gemini Embedding 2 — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем сопоставление текста и изображений в единое векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуется: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает её хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.

Провайдер для Google: Gemini Embedding 2

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

google

Latency

—

Throughput

—

Uptime

—

Контекст

8К

токенов

Макс. ответ

—

Вход

22,41 ₽

за 1М токенов

Выход

бесплатно

за 1М токенов

Изображения

бесплатно

за вход

Модальности

Вход:ТекстИзображенияФайлыАудиоВидеоВыход:Эмбеддинги

Поддерживаемые параметры

max_tokensresponse_formatseedtemperaturetop_p

Тарификация для Google: Gemini Embedding 2

Цены в рублях за 1 млн токенов. Списание — за реальные токены, без подписок.

Тип	Цена в ₽	Единица
Вход	22,41 ₽	за 1М токенов
Выход	бесплатно	за 1М токенов
Аудио	728,30 ₽	за 1М токенов
Изображения	бесплатно	за входящее изображение

Пример кода и API для Google: Gemini Embedding 2

Hubris — OpenAI-совместимый API. Используйте любой OpenAI SDK, поменяв только base URL и ключ.

Получить API-ключ

curl https://api.hubris.pw/v1/chat/completions \
  -H "Authorization: Bearer sk-gw-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemini-embedding-2",
    "messages": [{"role": "user", "content": "Привет"}]
  }'

curl https://api.hubris.pw/v1/chat/completions \  -H "Authorization: Bearer sk-gw-..." \  -H "Content-Type: application/json" \  -d '{    "model": "google/gemini-embedding-2",    "messages": [{"role": "user", "content": "Привет"}]  }'

from openai import OpenAI

client = OpenAI(
    base_url="https://api.hubris.pw/v1",
    api_key="sk-gw-...",
)

response = client.chat.completions.create(
    model="google/gemini-embedding-2",
    messages=[{"role": "user", "content": "Привет"}],
)
print(response.choices[0].message.content)

from openai import OpenAIclient = OpenAI(    base_url="https://api.hubris.pw/v1",    api_key="sk-gw-...",)response = client.chat.completions.create(    model="google/gemini-embedding-2",    messages=[{"role": "user", "content": "Привет"}],)print(response.choices[0].message.content)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.hubris.pw/v1",
  apiKey: process.env.HUBRIS_API_KEY!,
});

const response = await client.chat.completions.create({
  model: "google/gemini-embedding-2",
  messages: [{ role: "user", content: "Привет" }],
});

console.log(response.choices[0].message.content);

import OpenAI from "openai";const client = new OpenAI({  baseURL: "https://api.hubris.pw/v1",  apiKey: process.env.HUBRIS_API_KEY!,});const response = await client.chat.completions.create({  model: "google/gemini-embedding-2",  messages: [{ role: "user", content: "Привет" }],});console.log(response.choices[0].message.content);

Другие модели от google

Google: Gemini 2.5 Flash

Gemini 2.5 Flash — это передовая рабочая модель Google, специально разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она включает встроенные возможности «мышления», что позволяет ей предоставлять ответы с большей точностью и тонким учётом контекста. Кроме того, Gemini 2.5 Flash настраивается с помощью параметра «max tokens for reasoning», как описано в документации.

1.0М контекст·от 33,61 ₽/М

Google: Gemini 3.5 Flash

Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, обеспечивающая уровень кодирования и рассуждений, близкий к Pro, при стоимости и скорости уровня Flash. Она высоко оптимизирована для навыков кодирования и параллельных агентных циклов выполнения, поддерживая ввод текста, изображений, видео, аудио и PDF. По умолчанию используется средний уровень мыслительных усилий для более быстрых и экономичных ответов, с полной поддержкой уровней мышления (минимальный, низкий, средний, высокий) для точной настройки компромиссов между стоимостью и производительностью.

1.0М контекст·от 168,07 ₽/М

Google: Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image)

Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image) — это самая быстрая и экономичная модель изображений Gemini от Google, созданная для высокоскоростных конвейеров разработчиков и быстрого визуального исследования. Она обеспечивает генерацию текста в изображение примерно за 4 секунды — примерно в 2,7 раза быстрее, чем Gemini 3.1 Flash Image — сохраняя при этом согласованность символов, точное редактирование и реальные знания семейства Nano Banana. Единый API обрабатывает генерацию текста в изображение, редактирование изображений и композицию из нескольких изображений. Как мультимодальная модель, она также возвращает текст вместе с изображениями. Выходные данные генерируются в разрешении 1K с 14 соотношениями сторон и содержат невидимый водяной знак SynthID, чтобы их можно было идентифицировать как сгенерированные ИИ. Позиционируемая как лучший баланс качества и скорости в линейке Nano Banana 2, она позволяет генерировать тысячи изображений за небольшую часть стоимости более тяжёлых производственных моделей — идеально подходит для прототипирования, приложений реального времени и визуальных рабочих процессов в масштабе.

66К контекст·от 28,01 ₽/М

Google: Nano Banana 2 (Gemini 3.1 Flash Image)

Gemini 3.1 Flash Image, также известный как "Nano Banana 2", — это новейшая передовая модель Google для генерации и редактирования изображений, обеспечивающая визуальное качество профессионального уровня на скорости Flash. Она сочетает в себе расширенное контекстное понимание с быстрым и экономичным выводом, делая сложную генерацию изображений и итеративное редактирование значительно более доступными. Соотношение сторон можно контролировать с помощью параметра image_config API.

131К контекст·от 56,02 ₽/М

Google: Nano Banana Pro (Gemini 3 Pro Image)

Nano Banana Pro — это самая передовая модель Google для генерации и редактирования изображений, построенная на базе Gemini 3 Pro. Она расширяет возможности оригинальной Nano Banana за счет значительно улучшенного мультимодального мышления, привязки к реальному миру и высококачественного визуального синтеза. Модель генерирует контекстно-обогащенную графику, от инфографики и диаграмм до кинематографических композиций, и может включать информацию в реальном времени посредством привязки к Поиску. Она предлагает лучшее в отрасли отображение текста на изображениях (включая длинные отрывки и многоязычные макеты), последовательное смешивание нескольких изображений и точное сохранение идентичности до пяти объектов. Nano Banana Pro добавляет детальные творческие элементы управления, такие как локализованное редактирование, настройка освещения и фокуса, преобразования камеры, а также поддержку вывода 2K/4K и гибких соотношений сторон. Она разработана для профессионального дизайна, визуализации продуктов, раскадровки и сложных многоэлементных композиций, оставаясь при этом эффективной для общих рабочих процессов создания изображений.

66К контекст·от 224,09 ₽/М

Google: Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google, оптимизированная для рабочих нагрузок с низкой задержкой и большим объемом. Она поддерживает ввод текста, изображений, видео, аудио и PDF-файлов, а также предназначена для легковесных агентских рабочих процессов, простого извлечения данных и приложений, где основными ограничениями являются скорость отклика и стоимость API. Поддерживает полные уровни мышления (минимальный, низкий, средний, высокий) для точной настройки соотношения затрат и производительности.

1.0М контекст·от 28,01 ₽/М