Логотип Qwen — провайдер модели Qwen: Qwen Plus 0728 (thinking)

Qwen: Qwen Plus 0728 (thinking)

qwen/qwen-plus-2025-07-28:thinking
qwen
Выпущена 8 сентября 2025 г.|1.0М контекст|27,59 ₽/М вход|82,76 ₽/М выход

Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом в 1 миллион токенов, обладающую сбалансированным сочетанием производительности, скорости и стоимости.

Провайдер для Qwen: Qwen Plus 0728 (thinking)

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

qwen
Контекст
1.0М
токенов
Макс. ответ
33К
токенов
Вход
27,59 ₽
за 1М токенов
Выход
82,76 ₽
за 1М токенов
Кеш запись
34,48 ₽
за 1М токенов

Модальности

Вход:ТекстВыход:Текст

Поддерживаемые параметры

include_reasoningmax_tokenspresence_penaltyreasoningresponse_formatseedstructured_outputstemperaturetool_choicetoolstop_p

Другие модели от qwen

Qwen: Qwen3.7 Plus

Qwen3.7-Plus — это экономичная модель из серии Qwen3.7 от Alibaba. Она поддерживает ввод текста и изображений с текстовым выводом, развивая текстовые возможности серии с комплексным обновлением её визуально-языковых способностей, сохраняя при этом полнофункциональный интеллект агентского уровня для кодирования, использования инструментов и рабочих процессов повышения производительности. Её отличительной чертой является мультимодальная интерактивная гибридная агентская способность: она может воспринимать реальные сцены, читать экраны и взаимодействовать с графическими интерфейсами, генерировать код по визуальным ссылкам и выполнять сквозную навигацию в мобильных приложениях.

1.0М контекст·от 33,95 ₽/М

Qwen: Qwen3.7 Max

Qwen3.7-Max — это флагманская модель в серии Qwen3.7 от Alibaba. Она поддерживает ввод и вывод текста и разработана для рабочих нагрузок, ориентированных на агентов, с особыми преимуществами в кодировании, офисных и продуктивных задачах, а также в автономном выполнении с длительным горизонтом. Модель предлагает заметные улучшения в кодировании и агентском исполнении по сравнению с предыдущими поколениями Qwen и поддерживает явное кэширование prompt для эффективного повторного использования контекста.

1.0М контекст·от 132,63 ₽/М

Qwen: Qwen3.5 Plus 2026-04-20

Qwen3.5 Plus (апрель 2026) — это крупномасштабная мультиканальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, при этом размер контекстного окна составляет 1M токенов. Это обновленная версия Qwen3.5 Plus с многоуровневой тарификацией при использовании более 256K токенов.

1.0М контекст·от 31,83 ₽/М

Qwen: Qwen3.6 Flash

Qwen3.6 Flash — это быстрая и эффективная языковая модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов. Многоуровневое ценообразование применяется при использовании более 256 тысяч токенов. Поддерживается кэширование промптов, с ценообразованием как за явное чтение кэша, так и за создание кэша.

1.0М контекст·от 19,89 ₽/М

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это открытая мультимодальная модель от Alibaba Cloud с общим количеством параметров 35 миллиардов и 3 миллиардами активных параметров на токен. Она использует гибридную разреженную архитектуру Mixture-of-Experts, сочетающую линейное внимание Gated DeltaNet со стандартными слоями внимания с гейтингом, что обеспечивает эффективный вывод при значительно меньших вычислительных затратах. Модель поддерживает нативное контекстное окно в 262K токенов (расширяемое до 1M с помощью YaRN) и принимает текстовые, графические и видеовходы. Она включает интегрированный режим мышления с сохранением трассировок рассуждений в многоходовых диалогах, вызов функций и структурированный вывод. Выпущена под лицензией Apache 2.0.

262К контекст·от 15,92 ₽/М

Qwen: Qwen3.6 Max Preview

Qwen3.6-Max-Preview — это проприетарная передовая модель от Alibaba Cloud, построенная на разреженной архитектуре mixture-of-experts с примерно 1 триллионом общих параметров. Она оптимизирована для агентного кодирования, использования инструментов и рассуждений в длинном контексте, поддерживая контекстное окно в 262K токенов. Модель включает интегрированный режим мышления, который сохраняет следы рассуждений в многоходовых диалогах и поддерживает структурированный вывод и вызов функций. Доступ предоставляется исключительно через Alibaba Cloud Model Studio и Qwen Studio API; открытые веса не предоставляются.

262К контекст·от 110,35 ₽/М