Gemini 3 Flash Preview — это высокоскоростная, высокоэффективная модель мышления, разработанная для агентских рабочих процессов, многоходовых чатов и помощи в кодировании. Она обеспечивает производительность рассуждений и использования инструментов, близкую к уровню Pro, со значительно меньшей задержкой, чем более крупные варианты Gemini, что делает ее хорошо подходящей для интерактивной разработки, длительных агентских циклов и совместных задач кодирования. По сравнению с Gemini 2.5 Flash, она обеспечивает широкие улучшения качества в рассуждениях, мультимодальном понимании и надежности.
Модель поддерживает контекстное окно в 1M токенов и мультимодальные входы, включая текст, изображения, аудио, видео и PDF-файлы, с текстовым выводом. Она включает настраиваемые рассуждения через уровни мышления (минимальный, низкий, средний, высокий), структурированный вывод, использование инструментов и автоматическое кэширование контекста. Gemini 3 Flash Preview оптимизирована для пользователей, которым нужны сильные рассуждения и агентское поведение без затрат или задержек полномасштабных передовых моделей.
Провайдер для Google: Gemini 3 Flash Preview
Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.
Модальности
Поддерживаемые параметры
Другие модели от google
Google: Gemini Embedding 2
Gemini Embedding 2 — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем сопоставление текста и изображений в единое векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуется: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает её хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.
Google: Gemini 3.5 Flash
Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, обеспечивающая уровень кодирования и рассуждений, близкий к Pro, при стоимости и скорости уровня Flash. Она высоко оптимизирована для навыков кодирования и параллельных агентных циклов выполнения, поддерживая ввод текста, изображений, видео, аудио и PDF. По умолчанию используется средний уровень мыслительных усилий для более быстрых и экономичных ответов, с полной поддержкой уровней мышления (минимальный, низкий, средний, высокий) для точной настройки компромиссов между стоимостью и производительностью.
Google: Gemini 3.1 Flash Lite
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google, оптимизированная для рабочих нагрузок с низкой задержкой и большим объемом. Она поддерживает ввод текста, изображений, видео, аудио и PDF-файлов, а также предназначена для легковесных агентских рабочих процессов, простого извлечения данных и приложений, где основными ограничениями являются скорость отклика и стоимость API. Поддерживает полные уровни мышления (минимальный, низкий, средний, высокий) для точной настройки соотношения затрат и производительности.
Google Gemini Pro Latest
Эта модель всегда перенаправляет на последнюю модель семейства Google Gemini Pro.
Google Gemini Flash Latest
Эта модель всегда перенаправляет на последнюю модель из семейства Google Gemini Flash.
Google: Gemini Embedding 2 Preview
Gemini Embedding 2 Preview — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем отображение текста и изображений в унифицированное векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуемые: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает ее хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.