Логотип Qwen — провайдер модели Qwen2.5 72B Instruct

Qwen2.5 72B Instruct

qwen/qwen-2.5-72b-instruct
qwen
Выпущена 19 сентября 2024 г.|131К контекст|38,20 ₽/М вход|42,44 ₽/М выход

Qwen2.5 72B — это новейшая серия больших языковых моделей Qwen. Qwen2.5 включает следующие улучшения по сравнению с Qwen2:

  • Значительно больше знаний и значительно улучшенные возможности в кодировании и математике, благодаря нашим специализированным экспертным моделям в этих областях.

  • Значительные улучшения в следовании инструкциям, генерации длинных текстов (более 8K токенов), понимании структурированных данных (например, таблиц) и генерации структурированных выходных данных, особенно JSON. Более устойчив к разнообразию системных prompt'ов, улучшая реализацию ролевых игр и настройку условий для чат-ботов.

  • Поддержка длинного контекста до 128K токенов и возможность генерировать до 8K токенов.

  • Многоязычная поддержка для более чем 29 языков, включая китайский, английский, французский, испанский, португальский, немецкий, итальянский, русский, японский, корейский, вьетнамский, тайский, арабский и другие.

Использование этой модели регулируется ЛИЦЕНЗИОННЫМ СОГЛАШЕНИЕМ Tongyi Qianwen.

Провайдер для Qwen2.5 72B Instruct

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

qwen
Контекст
131К
токенов
Макс. ответ
16К
токенов
Вход
38,20 ₽
за 1М токенов
Выход
42,44 ₽
за 1М токенов

Модальности

Вход:ТекстВыход:Текст

Поддерживаемые параметры

frequency_penaltylogit_biasmax_tokensmin_ppresence_penaltyrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_p

Другие модели от qwen

Qwen: Qwen3.7 Plus

Qwen3.7-Plus — это экономичная модель из серии Qwen3.7 от Alibaba. Она поддерживает ввод текста и изображений с текстовым выводом, развивая текстовые возможности серии с комплексным обновлением её визуально-языковых способностей, сохраняя при этом полнофункциональный интеллект агентского уровня для кодирования, использования инструментов и рабочих процессов повышения производительности. Её отличительной чертой является мультимодальная интерактивная гибридная агентская способность: она может воспринимать реальные сцены, читать экраны и взаимодействовать с графическими интерфейсами, генерировать код по визуальным ссылкам и выполнять сквозную навигацию в мобильных приложениях.

1.0М контекст·от 33,95 ₽/М

Qwen: Qwen3.7 Max

Qwen3.7-Max — это флагманская модель в серии Qwen3.7 от Alibaba. Она поддерживает ввод и вывод текста и разработана для рабочих нагрузок, ориентированных на агентов, с особыми преимуществами в кодировании, офисных и продуктивных задачах, а также в автономном выполнении с длительным горизонтом. Модель предлагает заметные улучшения в кодировании и агентском исполнении по сравнению с предыдущими поколениями Qwen и поддерживает явное кэширование prompt для эффективного повторного использования контекста.

1.0М контекст·от 132,63 ₽/М

Qwen: Qwen3.5 Plus 2026-04-20

Qwen3.5 Plus (апрель 2026) — это крупномасштабная мультиканальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, при этом размер контекстного окна составляет 1M токенов. Это обновленная версия Qwen3.5 Plus с многоуровневой тарификацией при использовании более 256K токенов.

1.0М контекст·от 31,83 ₽/М

Qwen: Qwen3.6 Flash

Qwen3.6 Flash — это быстрая и эффективная языковая модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов. Многоуровневое ценообразование применяется при использовании более 256 тысяч токенов. Поддерживается кэширование промптов, с ценообразованием как за явное чтение кэша, так и за создание кэша.

1.0М контекст·от 19,89 ₽/М

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это открытая мультимодальная модель от Alibaba Cloud с общим количеством параметров 35 миллиардов и 3 миллиардами активных параметров на токен. Она использует гибридную разреженную архитектуру Mixture-of-Experts, сочетающую линейное внимание Gated DeltaNet со стандартными слоями внимания с гейтингом, что обеспечивает эффективный вывод при значительно меньших вычислительных затратах. Модель поддерживает нативное контекстное окно в 262K токенов (расширяемое до 1M с помощью YaRN) и принимает текстовые, графические и видеовходы. Она включает интегрированный режим мышления с сохранением трассировок рассуждений в многоходовых диалогах, вызов функций и структурированный вывод. Выпущена под лицензией Apache 2.0.

262К контекст·от 15,92 ₽/М

Qwen: Qwen3.6 Max Preview

Qwen3.6-Max-Preview — это проприетарная передовая модель от Alibaba Cloud, построенная на разреженной архитектуре mixture-of-experts с примерно 1 триллионом общих параметров. Она оптимизирована для агентного кодирования, использования инструментов и рассуждений в длинном контексте, поддерживая контекстное окно в 262K токенов. Модель включает интегрированный режим мышления, который сохраняет следы рассуждений в многоходовых диалогах и поддерживает структурированный вывод и вызов функций. Доступ предоставляется исключительно через Alibaba Cloud Model Studio и Qwen Studio API; открытые веса не предоставляются.

262К контекст·от 110,35 ₽/М