К каталогу

Qwen: Qwen3 235B A22B Thinking 2507

qwen/qwen3-235b-a22b-thinking-2507
Использовать
Выпущена 25 июля 2025 г.|131К контекст|12,21 ₽/М вход|122,05 ₽/М выход

Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная языковая модель Mixture-of-Experts (MoE) с открытым весом, оптимизированная для сложных задач рассуждения. Она активирует 22B из своих 235B параметров за один прямой проход и нативно поддерживает контекст до 262 144 токенов. Этот вариант, ориентированный «только на мышление», улучшает структурированное логическое рассуждение, математику, науку и генерацию длинных текстов, демонстрируя высокие результаты в бенчмарках AIME, SuperGPQA, LiveCodeBench и MMLU-Redux. Он принудительно использует специальный режим рассуждения (</think>) и разработан для генерации большого количества токенов (до 81 920 токенов) в сложных областях.

Модель настроена на выполнение инструкций и превосходно справляется с пошаговым рассуждением, использованием инструментов, агентными рабочими процессами и многоязычными задачами. Этот релиз представляет собой самый мощный вариант с открытым исходным кодом в серии Qwen3-235B, превосходящий многие закрытые модели в сценариях использования структурированного рассуждения.

Провайдер для Qwen: Qwen3 235B A22B Thinking 2507

Hubris маршрутизирует запросы через OpenRouter к лучшему доступному провайдеру с автоматическим fallback при сбоях.

Контекст
131К
токенов
Макс. ответ
Вход
12,21 ₽
за 1М токенов
Выход
122,05 ₽
за 1М токенов

Модальности

Вход:ТекстВыход:Текст

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogit_biasmax_tokensmin_ppresence_penaltyreasoningrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_p

Другие модели от qwen

Qwen: Qwen3.5 Plus 2026-04-20

Qwen3.5 Plus (апрель 2026) — это крупномасштабная мультиканальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, при этом размер контекстного окна составляет 1M токенов. Это обновленная версия Qwen3.5 Plus с многоуровневой тарификацией при использовании более 256K токенов.

1.0М контекст·от 32,66 ₽

Qwen: Qwen3.6 Flash

Qwen3.6 Flash — это быстрая и эффективная языковая модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов. Многоуровневое ценообразование применяется при использовании более 256 тысяч токенов. Поддерживается кэширование промптов, с ценообразованием как за явное чтение кэша, так и за создание кэша.

1.0М контекст·от 20,41 ₽

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это открытая мультимодальная модель от Alibaba Cloud с общим количеством параметров 35 миллиардов и 3 миллиардами активных параметров на токен. Она использует гибридную разреженную архитектуру Mixture-of-Experts, сочетающую линейное внимание Gated DeltaNet со стандартными слоями внимания с гейтингом, что обеспечивает эффективный вывод при значительно меньших вычислительных затратах. Модель поддерживает нативное контекстное окно в 262K токенов (расширяемое до 1M с помощью YaRN) и принимает текстовые, графические и видеовходы. Она включает интегрированный режим мышления с сохранением трассировок рассуждений в многоходовых диалогах, вызов функций и структурированный вывод. Выпущена под лицензией Apache 2.0.

262К контекст·от 13,16 ₽

Qwen: Qwen3.6 Max Preview

Qwen3.6-Max-Preview — это проприетарная передовая модель от Alibaba Cloud, построенная на разреженной архитектуре mixture-of-experts с примерно 1 триллионом общих параметров. Она оптимизирована для агентного кодирования, использования инструментов и рассуждений в длинном контексте, поддерживая контекстное окно в 262K токенов. Модель включает интегрированный режим мышления, который сохраняет следы рассуждений в многоходовых диалогах и поддерживает структурированный вывод и вызов функций. Доступ предоставляется исключительно через Alibaba Cloud Model Studio и Qwen Studio API; открытые веса не предоставляются.

262К контекст·от 84,91 ₽

Qwen: Qwen3.6 27B

Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров от команды Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальными возможностями — принимает текстовые, графические и видеовходы — и поддерживает контекстное окно размером 262 144 токена. Модель разработана для агентского кодирования и задач рассуждения, с особой силой в понимании кода на уровне репозитория, рабочих процессах фронтенд-разработки и многошаговом решении проблем. Она включает встроенный режим мышления для расширенного рассуждения и сохраняет контекст мышления на протяжении всей истории разговора. Qwen3.6 27B поддерживает 201 язык и диалект и выпускается под лицензией Apache 2.0.

262К контекст·от 26,13 ₽

Qwen: Qwen3.6 Plus

Qwen 3.6 Plus основан на гибридной архитектуре, которая сочетает эффективное линейное внимание с разреженной маршрутизацией mixture-of-experts, обеспечивая высокую масштабируемость и производительность вывода. По сравнению с серией 3.5, он демонстрирует значительные улучшения в агентном кодировании, фронтенд-разработке и общем рассуждении, с существенно улучшенным опытом «vibe coding». Модель превосходно справляется со сложными задачами, такими как 3D-сцены, игры и решение проблем на уровне репозитория, достигая 78,8 баллов на SWE-bench Verified. Она представляет собой значительный скачок как в чисто текстовых, так и в мультимодальных возможностях, работая на уровне ведущих современных моделей.

1.0М контекст·от 26,53 ₽