DeepSeek: DeepSeek V4 Pro

deepseek/deepseek-v4-pro

Выпущена 24 апреля 2026 г.|1.0М контекст|49,14 ₽/М вход|98,27 ₽/М выход

DeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с общим количеством параметров 1,6T и 49B активированных параметров, поддерживающая контекстное окно в 1M токенов. Она разработана для продвинутого рассуждения, кодирования и рабочих процессов агентов с длительным горизонтом, демонстрируя высокую производительность в тестах по знаниям, математике и разработке программного обеспечения.

Построенная на той же архитектуре, что и DeepSeek V4 Flash, она представляет гибридную систему attention для эффективной обработки длинного контекста. Поддерживаются уровни рассуждения high и xhigh; xhigh соответствует максимальному уровню рассуждения. Модель хорошо подходит для сложных рабочих нагрузок, таких как анализ всей кодовой базы, многошаговая автоматизация и крупномасштабный синтез информации, где критически важны как возможности, так и эффективность.

Провайдер для DeepSeek: DeepSeek V4 Pro

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

deepseek

Latency

—

Throughput

—

Uptime

—

Контекст

1.0М

токенов

Макс. ответ

384К

токенов

Вход

49,14 ₽

за 1М токенов

Выход

98,27 ₽

за 1М токенов

Кеш чтение

0,410 ₽

за 1М токенов

Модальности

Вход:ТекстВыход:Текст

Провайдеры

Запросы обслуживает один из провайдеров ниже — маршрутизация автоматически выбирает оптимального по доступности и скорости в момент запроса. Итоговая стоимость зависит от того, какой провайдер обслужил запрос, и от попадания в кэш: при повторяющемся контексте вход тарифицируется по цене чтения кэша — до 60–80 % дешевле. Цены — в рублях за 1 млн токенов.

Средняя фактическая цена

37,07 ₽

по запросам за 30 дней · за 1 млн токенов


DeepSeek	49,14 ₽	98,27 ₽	0,410 ₽	—	99,9 %	< 0,1 %
Baidu−63 %	~~190,89 ₽~~70,63 ₽	~~381,81 ₽~~141,27 ₽	~~15,81 ₽~~5,85 ₽	46 т/с	99,7 %	19,5 %
StreamLake−62 %	~~199,13 ₽~~75,67 ₽	~~398,26 ₽~~151,34 ₽	~~16,61 ₽~~6,31 ₽	40 т/с	98,3 %	45,5 %
GMICloud−61 %	~~196,54 ₽~~76,65 ₽	~~393,10 ₽~~153,31 ₽	~~16,38 ₽~~6,39 ₽	62 т/с	98,5 %	12,4 %
Ionstream	127,76 ₽	255,51 ₽	10,62 ₽	—	92,5 %	< 0,1 %
Novita−27 %	~~180,74 ₽~~131,94 ₽	~~361,47 ₽~~263,87 ₽	~~15,25 ₽~~11,13 ₽	60 т/с	99,7 %	7,2 %
DeepInfra	146,85 ₽	293,69 ₽	11,30 ₽	51 т/с	99,7 %	2,7 %
DigitalOcean	157,24 ₽	314,48 ₽	39,31 ₽	—	98,1 %	< 0,1 %
Alibaba	159,95 ₽	319,90 ₽	13,33 ₽	55 т/с	99,5 %	2,4 %
SiliconFlow	169,62 ₽	354,13 ₽	15,25 ₽	45 т/с	99,2 %	4,3 %
Venice	186,38 ₽	372,88 ₽	37,28 ₽	—	97,8 %	< 0,1 %
AtlasCloud	189,77 ₽	381,80 ₽	14,68 ₽	58 т/с	97,3 %	1,8 %
BaseTen	196,55 ₽	393,10 ₽	16,38 ₽	—	98,7 %	< 0,1 %
Parasail	196,55 ₽	393,10 ₽	11,30 ₽	—	97,1 %	< 0,1 %
Cloudflare	196,55 ₽	393,10 ₽	16,38 ₽	—	99,9 %	< 0,1 %
Together	196,55 ₽	393,10 ₽	22,59 ₽	—	98,7 %	< 0,1 %
CoreWeave	196,55 ₽	393,10 ₽	15,81 ₽	—	97,1 %	< 0,1 %
Fireworks	196,55 ₽	393,10 ₽	16,38 ₽	—	84,2 %	< 0,1 %

Доля запросов, скорость и латентность считаются по нашему трафику за 30 дней, в разрезе по провайдеру. У одного провайдера может быть несколько строк — разные регионы или тарифы с отдельными ценами; эти значения общие для провайдера, поэтому в таких строках они совпадают.

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogit_biaslogprobsmax_tokensmin_ppresence_penaltyreasoningreasoning_effortrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_logprobstop_p

Тарификация для DeepSeek: DeepSeek V4 Pro

Цены в рублях за 1 млн токенов. Списание — за реальные токены, без подписок.

Тип	Цена в ₽	Единица
Вход	49,14 ₽	за 1М токенов
Выход	98,27 ₽	за 1М токенов
Кэш: чтение	0,410 ₽	за 1М токенов

Пример кода и API для DeepSeek: DeepSeek V4 Pro

Hubris — OpenAI-совместимый API. Используйте любой OpenAI SDK, поменяв только base URL и ключ.

Получить API-ключ

curl https://api.hubris.pw/v1/chat/completions \
  -H "Authorization: Bearer sk-gw-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v4-pro",
    "messages": [{"role": "user", "content": "Привет"}]
  }'

curl https://api.hubris.pw/v1/chat/completions \  -H "Authorization: Bearer sk-gw-..." \  -H "Content-Type: application/json" \  -d '{    "model": "deepseek/deepseek-v4-pro",    "messages": [{"role": "user", "content": "Привет"}]  }'

from openai import OpenAI

client = OpenAI(
    base_url="https://api.hubris.pw/v1",
    api_key="sk-gw-...",
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-pro",
    messages=[{"role": "user", "content": "Привет"}],
)
print(response.choices[0].message.content)

from openai import OpenAIclient = OpenAI(    base_url="https://api.hubris.pw/v1",    api_key="sk-gw-...",)response = client.chat.completions.create(    model="deepseek/deepseek-v4-pro",    messages=[{"role": "user", "content": "Привет"}],)print(response.choices[0].message.content)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.hubris.pw/v1",
  apiKey: process.env.HUBRIS_API_KEY!,
});

const response = await client.chat.completions.create({
  model: "deepseek/deepseek-v4-pro",
  messages: [{ role: "user", content: "Привет" }],
});

console.log(response.choices[0].message.content);

import OpenAI from "openai";const client = new OpenAI({  baseURL: "https://api.hubris.pw/v1",  apiKey: process.env.HUBRIS_API_KEY!,});const response = await client.chat.completions.create({  model: "deepseek/deepseek-v4-pro",  messages: [{ role: "user", content: "Привет" }],});console.log(response.choices[0].message.content);

Другие модели от deepseek

DeepSeek: DeepSeek V4 Flash 0731

DeepSeek V4 Flash 0731 — это разреженная модель mixture-of-experts от DeepSeek с 13 миллиардами активных параметров из 284 миллиардов общих. Эта переобученная версия подходит для кодирования, рассуждений и рабочих процессов агентов.

1.0М контекст·от 15,81 ₽/М

DeepSeek: DeepSeek V4 Flash

DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством параметров 284B и 13B активированных параметров, поддерживающая контекстное окно в 1M токенов. Она разработана для быстрого инференса и высокопроизводительных рабочих нагрузок, сохраняя при этом высокую производительность в рассуждениях и кодировании. Модель включает гибридный механизм attention для эффективной обработки длинного контекста. Поддерживаются уровни рассуждений `high` и `xhigh`; `xhigh` соответствует максимальному уровню рассуждений. Она хорошо подходит для таких приложений, как помощники по кодированию, чат-системы и рабочие процессы агентов, где важны скорость отклика и экономическая эффективность.

1.0М контекст·от 15,81 ₽/М

DeepSeek: DeepSeek V3.2

DeepSeek-V3.2 — это большая языковая модель, разработанная для гармоничного сочетания высокой вычислительной эффективности с мощными возможностями рассуждений и использования инструментов в качестве агента. Она представляет DeepSeek Sparse Attention (DSA), мелкозернистый механизм разреженного внимания, который снижает затраты на обучение и инференс, сохраняя при этом качество в сценариях с длинным контекстом. Масштабируемая структура пост-обучения с подкреплением дополнительно улучшает рассуждения, демонстрируя производительность класса GPT-5, и модель показала золотые результаты на IMO и IOI 2025 года. V3.2 также использует крупномасштабный конвейер синтеза агентских задач для лучшей интеграции рассуждений в настройки использования инструментов, повышая соответствие и обобщение в интерактивных средах. Пользователи могут управлять поведением рассуждений с помощью булевого параметра `reasoning` `enabled`.

164К контекст·от 30,39 ₽/М

DeepSeek: DeepSeek V3.2 Exp

DeepSeek-V3.2-Exp — это экспериментальная большая языковая модель, выпущенная DeepSeek в качестве промежуточного шага между V3.1 и будущими архитектурами. Она представляет DeepSeek Sparse Attention (DSA), механизм разреженного внимания с мелкой гранулярностью, разработанный для повышения эффективности обучения и инференса в сценариях с длинным контекстом при сохранении качества вывода. Пользователи могут управлять поведением рассуждений с помощью булевого параметра `reasoning` `enabled`. Модель обучалась в условиях, соответствующих V3.1-Terminus, чтобы обеспечить прямое сравнение. Бенчмаркинг показывает производительность примерно на уровне V3.1 в задачах рассуждения, кодирования и использования агентских инструментов, с незначительными компромиссами и улучшениями в зависимости от области. Этот выпуск сосредоточен на проверке архитектурных оптимизаций для расширенной длины контекста, а не на повышении точности выполнения задач, что делает его в первую очередь исследовательской моделью для изучения эффективных конструкций transformer.

164К контекст·от 30,50 ₽/М

DeepSeek: DeepSeek V3.1 Terminus

DeepSeek-V3.1 Terminus — это обновление [DeepSeek V3.1](/deepseek/deepseek-chat-v3.1), которое сохраняет исходные возможности модели, одновременно устраняя проблемы, о которых сообщали пользователи, включая языковую согласованность и возможности агентов, а также дополнительно оптимизируя производительность модели в кодировании и поисковых агентах. Это большая гибридная модель рассуждений (671B параметров, 37B активных), которая поддерживает как режимы мышления, так и не-мышления. Она расширяет базовую модель DeepSeek-V3 двухфазным процессом обучения с длинным контекстом, достигая до 128K токенов, и использует микромасштабирование FP8 для эффективного вывода. Пользователи могут управлять поведением рассуждений с помощью логического параметра `reasoning` `enabled`. Модель улучшает использование инструментов, генерацию кода и эффективность рассуждений, достигая производительности, сравнимой с DeepSeek-R1 на сложных бенчмарках, при этом отвечая быстрее. Она поддерживает структурированный вызов инструментов, кодовых агентов и поисковых агентов, что делает ее подходящей для исследований, кодирования и агентских рабочих процессов.

164К контекст·от 30,50 ₽/М

DeepSeek: DeepSeek V3.1

DeepSeek-V3.1 — это большая гибридная модель рассуждений (671B параметров, 37B активных), которая поддерживает как режимы мышления, так и не-мышления с помощью шаблонов prompt. Она расширяет базовую модель DeepSeek-V3 двухфазным процессом обучения на длинных контекстах, достигая до 128K токенов, и использует микромасштабирование FP8 для эффективного вывода. Пользователи могут управлять поведением рассуждений с помощью логического параметра `reasoning` `enabled`. Модель улучшает использование инструментов, генерацию кода и эффективность рассуждений, достигая производительности, сравнимой с DeepSeek-R1 на сложных бенчмарках, при этом отвечая быстрее. Она поддерживает структурированный вызов инструментов, кодовых агентов и поисковых агентов, что делает ее подходящей для исследований, кодирования и агентских рабочих процессов. Она является преемником модели [DeepSeek V3-0324](/deepseek/deepseek-chat-v3-0324) и хорошо справляется с различными задачами.

164К контекст·от 28,24 ₽/М