Gemini 3.1 Pro Preview — это передовая модель рассуждений от Google, обеспечивающая повышенную производительность в области разработки программного обеспечения, улучшенную надёжность агентов и более эффективное использование токенов в сложных рабочих процессах. Основываясь на мультимодальной базе серии Gemini 3, она сочетает высокоточное рассуждение по тексту, изображениям, видео, аудио и коду с контекстным окном в 1M токенов. Детали рассуждений должны сохраняться при использовании многошаговых вызовов инструментов, см. нашу документацию здесь: [ссылка]. Обновление 3.1 обеспечивает измеримые улучшения в бенчмарках SWE и реальных средах кодирования, а также более сильное автономное выполнение задач в структурированных областях, таких как финансы и рабочие процессы на основе электронных таблиц.
Разработанная для продвинутой разработки и агентных систем, Gemini 3.1 Pro Preview улучшает стабильность на длительных горизонтах и оркестрацию инструментов, одновременно повышая эффективность токенов. Она вводит новый средний уровень мышления для лучшего баланса стоимости, скорости и производительности. Модель превосходно справляется с агентным кодированием, структурированным планированием, мультимодальным анализом и автоматизацией рабочих процессов, что делает её хорошо подходящей для автономных агентов, финансового моделирования, автоматизации электронных таблиц и корпоративных задач с высоким контекстом.
Провайдер для Google: Gemini 3.1 Pro Preview
Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.
Модальности
Поддерживаемые параметры
Другие модели от google
Google: Gemini Embedding 2
Gemini Embedding 2 — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем сопоставление текста и изображений в единое векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуется: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает её хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.
Google: Gemini 3.5 Flash
Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, обеспечивающая уровень кодирования и рассуждений, близкий к Pro, при стоимости и скорости уровня Flash. Она высоко оптимизирована для навыков кодирования и параллельных агентных циклов выполнения, поддерживая ввод текста, изображений, видео, аудио и PDF. По умолчанию используется средний уровень мыслительных усилий для более быстрых и экономичных ответов, с полной поддержкой уровней мышления (минимальный, низкий, средний, высокий) для точной настройки компромиссов между стоимостью и производительностью.
Google: Gemini 3.1 Flash Lite
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google, оптимизированная для рабочих нагрузок с низкой задержкой и большим объемом. Она поддерживает ввод текста, изображений, видео, аудио и PDF-файлов, а также предназначена для легковесных агентских рабочих процессов, простого извлечения данных и приложений, где основными ограничениями являются скорость отклика и стоимость API. Поддерживает полные уровни мышления (минимальный, низкий, средний, высокий) для точной настройки соотношения затрат и производительности.
Google Gemini Pro Latest
Эта модель всегда перенаправляет на последнюю модель семейства Google Gemini Pro.
Google Gemini Flash Latest
Эта модель всегда перенаправляет на последнюю модель из семейства Google Gemini Flash.
Google: Gemini Embedding 2 Preview
Gemini Embedding 2 Preview — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем отображение текста и изображений в унифицированное векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуемые: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает ее хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.