К каталогу

Qwen: Qwen3 Embedding 4B

qwen/qwen3-embedding-4b
Использовать
Выпущена 28 октября 2025 г.|33К контекст|1,60 ₽/М вход|бесплатно/М выход

The Qwen3 Embedding model series is the latest proprietary model of the Qwen family, specifically designed for text embedding and ranking tasks. This series inherits the exceptional multilingual capabilities, long-text understanding, and reasoning skills of its foundational model. The Qwen3 Embedding series represents significant advancements in multiple text embedding and ranking tasks, including text retrieval, code retrieval, text classification, text clustering, and bitext mining.

Провайдер для Qwen: Qwen3 Embedding 4B

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

qwen
Контекст
33К
токенов
Макс. ответ
Вход
1,60 ₽
за 1М токенов
Выход
бесплатно
за 1М токенов

Модальности

Вход:ТекстВыход:Эмбеддинги

Поддерживаемые параметры

frequency_penaltymax_tokensmin_ppresence_penaltyrepetition_penaltyresponse_formatseedstoptemperaturetop_ktop_p

Другие модели от qwen

Qwen: Qwen3.5 Plus 2026-04-20

Qwen3.5 Plus (апрель 2026) — это крупномасштабная мультиканальная языковая модель от Alibaba. Она принимает на вход текст, изображения и видео, а на выходе генерирует текст, при этом размер контекстного окна составляет 1M токенов. Это обновленная версия Qwen3.5 Plus с многоуровневой тарификацией при использовании более 256K токенов.

1.0М контекст·от 32,02 ₽

Qwen: Qwen3.6 Flash

Qwen3.6 Flash — это быстрая и эффективная языковая модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов. Многоуровневое ценообразование применяется при использовании более 256 тысяч токенов. Поддерживается кэширование промптов, с ценообразованием как за явное чтение кэша, так и за создание кэша.

1.0М контекст·от 20,01 ₽

Qwen: Qwen3.6 35B A3B

Qwen3.6-35B-A3B — это открытая мультимодальная модель от Alibaba Cloud с общим количеством параметров 35 миллиардов и 3 миллиардами активных параметров на токен. Она использует гибридную разреженную архитектуру Mixture-of-Experts, сочетающую линейное внимание Gated DeltaNet со стандартными слоями внимания с гейтингом, что обеспечивает эффективный вывод при значительно меньших вычислительных затратах. Модель поддерживает нативное контекстное окно в 262K токенов (расширяемое до 1M с помощью YaRN) и принимает текстовые, графические и видеовходы. Она включает интегрированный режим мышления с сохранением трассировок рассуждений в многоходовых диалогах, вызов функций и структурированный вывод. Выпущена под лицензией Apache 2.0.

262К контекст·от 12,01 ₽

Qwen: Qwen3.6 Max Preview

Qwen3.6-Max-Preview — это проприетарная передовая модель от Alibaba Cloud, построенная на разреженной архитектуре mixture-of-experts с примерно 1 триллионом общих параметров. Она оптимизирована для агентного кодирования, использования инструментов и рассуждений в длинном контексте, поддерживая контекстное окно в 262K токенов. Модель включает интегрированный режим мышления, который сохраняет следы рассуждений в многоходовых диалогах и поддерживает структурированный вывод и вызов функций. Доступ предоставляется исключительно через Alibaba Cloud Model Studio и Qwen Studio API; открытые веса не предоставляются.

262К контекст·от 83,25 ₽

Qwen: Qwen3.6 27B

Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров от команды Qwen из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальными возможностями — принимает текстовые, графические и видеовходы — и поддерживает контекстное окно размером 262 144 токена. Модель разработана для агентского кодирования и задач рассуждения, с особой силой в понимании кода на уровне репозитория, рабочих процессах фронтенд-разработки и многошаговом решении проблем. Она включает встроенный режим мышления для расширенного рассуждения и сохраняет контекст мышления на протяжении всей истории разговора. Qwen3.6 27B поддерживает 201 язык и диалект и выпускается под лицензией Apache 2.0.

262К контекст·от 25,61 ₽

Qwen: Qwen3.6 Plus

Qwen 3.6 Plus основан на гибридной архитектуре, которая сочетает эффективное линейное внимание с разреженной маршрутизацией mixture-of-experts, обеспечивая высокую масштабируемость и производительность вывода. По сравнению с серией 3.5, он демонстрирует значительные улучшения в агентном кодировании, фронтенд-разработке и общем рассуждении, с существенно улучшенным опытом «vibe coding». Модель превосходно справляется со сложными задачами, такими как 3D-сцены, игры и решение проблем на уровне репозитория, достигая 78,8 баллов на SWE-bench Verified. Она представляет собой значительный скачок как в чисто текстовых, так и в мультимодальных возможностях, работая на уровне ведущих современных моделей.

1.0М контекст·от 26,02 ₽