Qwen: Qwen3 VL 235B A22B Instruct

qwen/qwen3-vl-235b-a22b-instruct

Выпущена 23 сентября 2025 г.|262К контекст|23,72 ₽/М вход|214,62 ₽/М выход

Qwen3-VL-235B-A22B Instruct — это открытая мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Модель Instruct предназначена для общего использования в задачах «зрение-язык» (VQA, анализ документов, извлечение диаграмм/таблиц, многоязычное оптическое распознавание символов). Серия моделей делает акцент на надёжном восприятии (распознавание разнообразных реальных и синтетических категорий), пространственном понимании (2D/3D привязка) и долгосрочном визуальном понимании, демонстрируя конкурентоспособные результаты в публичных мультимодальных бенчмарках как для восприятия, так и для рассуждений.

Помимо анализа, Qwen3-VL поддерживает агентное взаимодействие и использование инструментов: она может следовать сложным инструкциям в многоизобразительных, многоходовых диалогах; сопоставлять текст с временными шкалами видео для точных временных запросов; и управлять элементами графического интерфейса для задач автоматизации. Модели также позволяют использовать рабочие процессы визуального кодирования — превращать эскизы или макеты в код и помогать с отладкой пользовательского интерфейса — при этом сохраняя высокую производительность только для текста, сравнимую с флагманскими языковыми моделями Qwen3. Это делает Qwen3-VL подходящей для производственных сценариев, охватывающих документооборот с ИИ, многоязычное оптическое распознавание символов, помощь в разработке программного обеспечения/пользовательского интерфейса, пространственные/воплощённые задачи и исследования в области агентов «зрение-язык».

Провайдер для Qwen: Qwen3 VL 235B A22B Instruct

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

qwen

Latency

—

Throughput

—

Uptime

—

Контекст

262К

токенов

Макс. ответ

33К

токенов

Вход

23,72 ₽

за 1М токенов

Выход

214,62 ₽

за 1М токенов

Кеш чтение

11,30 ₽

за 1М токенов

Модальности

Вход:ТекстИзображенияВыход:Текст

Провайдеры

Запросы обслуживает один из провайдеров ниже — маршрутизация автоматически выбирает оптимального по доступности и скорости в момент запроса. Итоговая стоимость зависит от того, какой провайдер обслужил запрос, и от попадания в кэш: при повторяющемся контексте вход тарифицируется по цене чтения кэша — до 60–80 % дешевле. Цены — в рублях за 1 млн токенов.

Средняя фактическая цена

38,30 ₽

по запросам за 30 дней · за 1 млн токенов


DeepInfra	22,59 ₽	99,40 ₽	12,43 ₽	29 т/с	75,9 %	37,8 %
Venice	23,72 ₽	214,62 ₽	11,30 ₽	30 т/с	94,7 %	4,5 %
Parasail	23,72 ₽	214,62 ₽	11,30 ₽	24 т/с	99,4 %	22,1 %
Alibaba	29,37 ₽	117,48 ₽	—	38 т/с	99,9 %	18,9 %
Novita	33,89 ₽	169,44 ₽	—	17 т/с	94,5 %	16,8 %

Доля запросов, скорость и латентность считаются по нашему трафику за 30 дней, в разрезе по провайдеру. У одного провайдера может быть несколько строк — разные регионы или тарифы с отдельными ценами; эти значения общие для провайдера, поэтому в таких строках они совпадают.

Поддерживаемые параметры

frequency_penaltylogit_biaslogprobsmax_tokensmin_ppresence_penaltyrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_logprobstop_p

Тарификация для Qwen: Qwen3 VL 235B A22B Instruct

Цены в рублях за 1 млн токенов. Списание — за реальные токены, без подписок.

Тип	Цена в ₽	Единица
Вход	23,72 ₽	за 1М токенов
Выход	214,62 ₽	за 1М токенов
Кэш: чтение	11,30 ₽	за 1М токенов

Пример кода и API для Qwen: Qwen3 VL 235B A22B Instruct

Hubris — OpenAI-совместимый API. Используйте любой OpenAI SDK, поменяв только base URL и ключ.

Получить API-ключ

curl https://api.hubris.pw/v1/chat/completions \
  -H "Authorization: Bearer sk-gw-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-vl-235b-a22b-instruct",
    "messages": [{"role": "user", "content": "Привет"}]
  }'

curl https://api.hubris.pw/v1/chat/completions \  -H "Authorization: Bearer sk-gw-..." \  -H "Content-Type: application/json" \  -d '{    "model": "qwen/qwen3-vl-235b-a22b-instruct",    "messages": [{"role": "user", "content": "Привет"}]  }'

from openai import OpenAI

client = OpenAI(
    base_url="https://api.hubris.pw/v1",
    api_key="sk-gw-...",
)

response = client.chat.completions.create(
    model="qwen/qwen3-vl-235b-a22b-instruct",
    messages=[{"role": "user", "content": "Привет"}],
)
print(response.choices[0].message.content)

from openai import OpenAIclient = OpenAI(    base_url="https://api.hubris.pw/v1",    api_key="sk-gw-...",)response = client.chat.completions.create(    model="qwen/qwen3-vl-235b-a22b-instruct",    messages=[{"role": "user", "content": "Привет"}],)print(response.choices[0].message.content)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.hubris.pw/v1",
  apiKey: process.env.HUBRIS_API_KEY!,
});

const response = await client.chat.completions.create({
  model: "qwen/qwen3-vl-235b-a22b-instruct",
  messages: [{ role: "user", content: "Привет" }],
});

console.log(response.choices[0].message.content);

import OpenAI from "openai";const client = new OpenAI({  baseURL: "https://api.hubris.pw/v1",  apiKey: process.env.HUBRIS_API_KEY!,});const response = await client.chat.completions.create({  model: "qwen/qwen3-vl-235b-a22b-instruct",  messages: [{ role: "user", content: "Привет" }],});console.log(response.choices[0].message.content);

Другие модели от qwen

Qwen: Qwen3.7 Flash

Qwen3.7 Flash — это модель визуально-языкового рассуждения от Alibaba. Она подходит для мультимодальных агентов, визуального кодирования, поиска и компьютерного взаимодействия, обладая сильными сторонами в распознавании объектов, пространственном понимании и восприятии реального мира.

1.0М контекст·от 3,39 ₽/М

Qwen: Qwen-Audio-3.0-TTS Plus

Qwen-Audio-3.0-TTS Plus — это высококачественная модель преобразования текста в речь от Alibaba, генерирующая озвученный аудиоконтент из текста через API DashScope Speech Synthesizer.

— контекст·2 259,18 ₽ за 1М символов

Qwen: Qwen-Audio-3.0-TTS Flash

Qwen-Audio-3.0-TTS Flash — это быстрая и экономичная модель преобразования текста в речь от Alibaba, генерирующая озвученный аудиоконтент из текста через API DashScope Speech Synthesizer.

— контекст·1 694,39 ₽ за 1М символов

Qwen: Qwen3.7 Plus

Qwen3.7-Plus — это экономичная модель из серии Qwen3.7 от Alibaba. Она поддерживает ввод текста и изображений с текстовым выводом, развивая текстовые возможности серии с комплексным обновлением её визуально-языковых способностей, сохраняя при этом полнофункциональный интеллект агентского уровня для кодирования, использования инструментов и рабочих процессов повышения производительности. Её отличительной чертой является мультимодальная интерактивная гибридная агентская способность: она может воспринимать реальные сцены, читать экраны и взаимодействовать с графическими интерфейсами, генерировать код по визуальным ссылкам и выполнять сквозную навигацию в мобильных приложениях.

1.0М контекст·от 36,15 ₽/М

Qwen: Qwen3.7 Max

Qwen3.7-Max — это флагманская модель в серии Qwen3.7 от Alibaba. Она поддерживает ввод и вывод текста и разработана для рабочих нагрузок, ориентированных на агентов, с особыми преимуществами в кодировании, офисных и продуктивных задачах, а также в автономном выполнении с длительным горизонтом. Модель предлагает заметные улучшения в кодировании и агентском исполнении по сравнению с предыдущими поколениями Qwen и поддерживает явное кэширование prompt для эффективного повторного использования контекста.

1.0М контекст·от 166,61 ₽/М

Qwen: Qwen3 ASR Flash

Qwen3-ASR-Flash — это сервис автоматического распознавания речи от Alibaba, построенный на основе Qwen3-Omni и обученный на десятках миллионов часов мультимодальных речевых данных. Модель поддерживает 11 языков —...

— контекст·0,010 ₽ за секунду