Нейросети DeepSeek через API
В каталоге Hubris 12 моделей DeepSeek: генерация текста. Доступ через единый OpenAI-совместимый API, оплата картой РФ или СБП, без VPN. Цены — в рублях за токены.
deepseek-chat
DeepSeek-V3 — это новейшая модель от команды DeepSeek, основанная на возможностях следования инструкциям и написания кода предыдущих версий. Предварительно обученная на почти 15 триллионах токенов, согласно опубликованным оценкам, модель…
deepseek-chat-v3-0324
DeepSeek V3, модель с 685 миллиардами параметров и архитектурой Mixture-of-Experts, является последней итерацией флагманского семейства чат-моделей от команды DeepSeek.
deepseek-chat-v3.1
DeepSeek-V3.1 — это большая гибридная модель рассуждений (671B параметров, 37B активных), которая поддерживает как режимы мышления, так и не-мышления с помощью шаблонов prompt. Она расширяет базовую модель DeepSeek-V3 двухфазным процессом…
deepseek-v3.1-terminus
DeepSeek-V3.1 Terminus — это обновление [DeepSeek V3.1](/deepseek/deepseek-chat-v3.1), которое сохраняет исходные возможности модели, одновременно устраняя проблемы, о которых сообщали пользователи, включая языковую согласованность и…
deepseek-v3.2
DeepSeek-V3.2 — это большая языковая модель, разработанная для гармоничного сочетания высокой вычислительной эффективности с мощными возможностями рассуждений и использования инструментов в качестве агента. Она представляет DeepSeek Sparse…
deepseek-v3.2-exp
DeepSeek-V3.2-Exp — это экспериментальная большая языковая модель, выпущенная DeepSeek в качестве промежуточного шага между V3.1 и будущими архитектурами. Она представляет DeepSeek Sparse Attention (DSA), механизм разреженного внимания с…
deepseek-v4-flash
DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с общим количеством параметров 284B и 13B активированных параметров, поддерживающая контекстное окно в 1M токенов. Она разработана для быстрого…
deepseek-v4-pro
DeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с общим количеством параметров 1,6T и 49B активированных параметров, поддерживающая контекстное окно в 1M токенов. Она разработана для продвинутого рассуждения,…
deepseek-r1
DeepSeek R1 уже здесь: производительность на уровне [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Он имеет 671 миллиард параметров, из которых 37 миллиардов активны при проходе вывода.
deepseek-r1-0528
Обновление от 28 мая к [оригинальному DeepSeek R1](/deepseek/deepseek-r1). Производительность наравне с [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели составляет 671B…
deepseek-r1-distill-llama-70b
DeepSeek R1 Distill Llama 70B — это дистиллированная большая языковая модель, основанная на [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Модель сочетает в…
deepseek-r1-distill-qwen-32b
DeepSeek R1 Distill Qwen 32B — это дистиллированная большая языковая модель, основанная на [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Она превосходит o1-mini…