Gemini 2.5 Flash — это передовая рабочая модель Google, специально разработанная для решения сложных задач в области рассуждений, кодирования, математики и науки. Она включает встроенные возможности «мышления», что позволяет ей предоставлять ответы с большей точностью и тонкой обработкой контекста.
Кроме того, Gemini 2.5 Flash настраивается с помощью параметра «max tokens for reasoning», как описано в документации.
Провайдер для Google: Gemini 2.5 Flash
Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.
Модальности
Поддерживаемые параметры
Другие модели от google
Google: Gemini Embedding 2
Gemini Embedding 2 — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем сопоставление текста и изображений в единое векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуется: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает её хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.
Google: Gemini 3.5 Flash
Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, обеспечивающая уровень кодирования и рассуждений, близкий к Pro, при стоимости и скорости уровня Flash. Она высоко оптимизирована для навыков кодирования и параллельных агентных циклов выполнения, поддерживая ввод текста, изображений, видео, аудио и PDF. По умолчанию используется средний уровень мыслительных усилий для более быстрых и экономичных ответов, с полной поддержкой уровней мышления (минимальный, низкий, средний, высокий) для точной настройки компромиссов между стоимостью и производительностью.
Google: Gemini 3.1 Flash Lite
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google, оптимизированная для рабочих нагрузок с низкой задержкой и большим объемом. Она поддерживает ввод текста, изображений, видео, аудио и PDF-файлов, а также предназначена для легковесных агентских рабочих процессов, простого извлечения данных и приложений, где основными ограничениями являются скорость отклика и стоимость API. Поддерживает полные уровни мышления (минимальный, низкий, средний, высокий) для точной настройки соотношения затрат и производительности.
Google Gemini Pro Latest
Эта модель всегда перенаправляет на последнюю модель семейства Google Gemini Pro.
Google Gemini Flash Latest
Эта модель всегда перенаправляет на последнюю модель из семейства Google Gemini Flash.
Google: Gemini Embedding 2 Preview
Gemini Embedding 2 Preview — это первая мультимодальная модель встраивания от Google. В настоящее время мы поддерживаем отображение текста и изображений в унифицированное векторное пространство для семантического поиска и генерации с дополненной выборкой (RAG). Модель поддерживает входной контекст до 8192 токенов и гибкие выходные размерности от 128 до 3072 (рекомендуемые: 768, 1536 или 3072). Разработана для кросс-модального сходства — вы можете встроить текстовый запрос и получить наиболее релевантные изображения, или наоборот — что делает ее хорошо подходящей для мультимодального поиска, рекомендаций и конвейеров понимания документов.