Логотип Qwen — провайдер модели Qwen: Qwen3 VL 235B A22B Instruct

Qwen: Qwen3 VL 235B A22B Instruct

qwen/qwen3-vl-235b-a22b-instruct
qwen
Выпущена 23 сентября 2025 г.|262К контекст|21,22 ₽/М вход|93,37 ₽/М выход

Qwen3-VL-235B-A22B Instruct — это открытая мультимодальная модель, которая объединяет мощную генерацию текста с визуальным пониманием изображений и видео. Модель Instruct предназначена для общего использования в задачах «зрение-язык» (VQA, анализ документов, извлечение диаграмм/таблиц, многоязычное оптическое распознавание символов). Серия моделей делает акцент на надёжном восприятии (распознавание разнообразных реальных и синтетических категорий), пространственном понимании (2D/3D привязка) и долгосрочном визуальном понимании, демонстрируя конкурентоспособные результаты в публичных мультимодальных бенчмарках как для восприятия, так и для рассуждений.

Помимо анализа, Qwen3-VL поддерживает агентное взаимодействие и использование инструментов: она может следовать сложным инструкциям в многоизобразительных, многоходовых диалогах; сопоставлять текст с временными шкалами видео для точных временных запросов; и управлять элементами графического интерфейса для задач автоматизации. Модели также позволяют использовать рабочие процессы визуального кодирования — превращать эскизы или макеты в код и помогать с отладкой пользовательского интерфейса — при этом сохраняя высокую производительность только для текста, сравнимую с флагманскими языковыми моделями Qwen3. Это делает Qwen3-VL подходящей для производственных сценариев, охватывающих документооборот с ИИ, многоязычное оптическое распознавание символов, помощь в разработке программного обеспечения/пользовательского интерфейса, пространственные/воплощённые задачи и исследования в области агентов «зрение-язык».

Провайдер для Qwen: Qwen3 VL 235B A22B Instruct

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

qwen
Контекст
262К
токенов
Макс. ответ
16К
токенов
Вход
21,22 ₽
за 1М токенов
Выход
93,37 ₽
за 1М токенов
Кеш чтение
11,67 ₽
за 1М токенов

Модальности

Вход:ТекстИзображенияВыход:Текст

Поддерживаемые параметры

frequency_penaltylogit_biasmax_tokensmin_ppresence_penaltyrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_p

Другие модели от qwen

Qwen: Qwen3.7 Plus

Qwen3.7-Plus — это экономичная модель из серии Qwen3.7 от Alibaba. Она поддерживает ввод текста и изображений с текстовым выводом, развивая текстовые возможности серии с комплексным обновлением её визуально-языковых способностей, сохраняя при этом полнофункциональный интеллект агентского уровня для кодирования, использования инструментов и рабочих процессов повышения производительности. Её отличительной чертой является мультимодальная интерактивная гибридная агентская способность: она может воспринимать реальные сцены, читать экраны и взаимодействовать с графическими интерфейсами, генерировать код по визуальным ссылкам и выполнять сквозную навигацию в мобильных приложениях.

1.0М контекст·от 33,95 ₽/М

Qwen: Qwen3.7 Max

Qwen3.7-Max — это флагманская модель в серии Qwen3.7 от Alibaba. Она поддерживает ввод и вывод текста и разработана для рабочих нагрузок, ориентированных на агентов, с особыми преимуществами в кодировании, офисных и продуктивных задачах, а также в автономном выполнении с длительным горизонтом. Модель предлагает заметные улучшения в кодировании и агентском исполнении по сравнению с предыдущими поколениями Qwen и поддерживает явное кэширование prompt для эффективного повторного использования контекста.

1.0М контекст·от 132,63 ₽/М

Qwen: Qwen3.5 Plus 2026-04-20

Qwen3.5 Plus (апрель 2026) — это крупномасштабная мультиканальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, при этом размер контекстного окна составляет 1M токенов. Это обновленная версия Qwen3.5 Plus с многоуровневой тарификацией при использовании более 256K токенов.

1.0М контекст·от 31,83 ₽/М

Qwen: Qwen3.6 Flash

Qwen3.6 Flash — это быстрая и эффективная языковая модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов. Многоуровневое ценообразование применяется при использовании более 256 тысяч токенов. Поддерживается кэширование промптов, с ценообразованием как за явное чтение кэша, так и за создание кэша.

1.0М контекст·от 19,89 ₽/М

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это открытая мультимодальная модель от Alibaba Cloud с общим количеством параметров 35 миллиардов и 3 миллиардами активных параметров на токен. Она использует гибридную разреженную архитектуру Mixture-of-Experts, сочетающую линейное внимание Gated DeltaNet со стандартными слоями внимания с гейтингом, что обеспечивает эффективный вывод при значительно меньших вычислительных затратах. Модель поддерживает нативное контекстное окно в 262K токенов (расширяемое до 1M с помощью YaRN) и принимает текстовые, графические и видеовходы. Она включает интегрированный режим мышления с сохранением трассировок рассуждений в многоходовых диалогах, вызов функций и структурированный вывод. Выпущена под лицензией Apache 2.0.

262К контекст·от 15,92 ₽/М

Qwen: Qwen3.6 Max Preview

Qwen3.6-Max-Preview — это проприетарная передовая модель от Alibaba Cloud, построенная на разреженной архитектуре mixture-of-experts с примерно 1 триллионом общих параметров. Она оптимизирована для агентного кодирования, использования инструментов и рассуждений в длинном контексте, поддерживая контекстное окно в 262K токенов. Модель включает интегрированный режим мышления, который сохраняет следы рассуждений в многоходовых диалогах и поддерживает структурированный вывод и вызов функций. Доступ предоставляется исключительно через Alibaba Cloud Model Studio и Qwen Studio API; открытые веса не предоставляются.

262К контекст·от 110,35 ₽/М