MiniMax: MiniMax M3

minimax/minimax-m3

Выпущена 31 мая 2026 г.|1.0М контекст|33,61 ₽/М вход|134,46 ₽/М выход

MiniMax-M3 — это мультимодальная базовая модель от MiniMax. Она поддерживает текстовые, графические и видеовходы с текстовым выводом, имеет контекстное окно в 1M токенов и подходит для долгосрочной агентной работы, кодирования и использования инструментов. Модель построена на MiniMax Sparse Attention (MSA), которая заменяет полное внимание выбором KV-блоков для сокращения вычислений на токен при длинном контексте — примерно в 20 раз дешевле по сравнению с предыдущим поколением при 1M токенов, со значительно более быстрым заполнением и декодированием при сохранении качества в большинстве задач.

Обученная как нативная мультимодальная модель на перемежающихся данных и настроенная для многоэтапного, производственного сотрудничества с помощью интерактивной пользовательской симуляторной платформы, модель ориентирована на устойчивые, многошаговые задачи, а не на одноэтапное выполнение.

Провайдер для MiniMax: MiniMax M3

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

minimax

Latency

—

Throughput

—

Uptime

—

Контекст

1.0М

токенов

Макс. ответ

512К

токенов

Вход

33,61 ₽

за 1М токенов

Выход

134,46 ₽

за 1М токенов

Кеш чтение

6,72 ₽

за 1М токенов

Модальности

Вход:ТекстИзображенияВидеоВыход:Текст

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogit_biaslogprobsmax_tokensmin_ppresence_penaltyreasoningrepetition_penaltyresponse_formatseedstopstructured_outputstemperaturetool_choicetoolstop_ktop_logprobstop_p

Тарификация для MiniMax: MiniMax M3

Цены в рублях за 1 млн токенов. Списание — за реальные токены, без подписок.

Тип	Цена в ₽	Единица
Вход	33,61 ₽	за 1М токенов
Выход	134,46 ₽	за 1М токенов
Кеш чтение	6,72 ₽	за 1М токенов

Пример кода и API для MiniMax: MiniMax M3

Hubris — OpenAI-совместимый API. Используйте любой OpenAI SDK, поменяв только base URL и ключ.

Получить API-ключ

curl https://api.hubris.pw/v1/chat/completions \
  -H "Authorization: Bearer sk-gw-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "minimax/minimax-m3",
    "messages": [{"role": "user", "content": "Привет"}]
  }'

curl https://api.hubris.pw/v1/chat/completions \  -H "Authorization: Bearer sk-gw-..." \  -H "Content-Type: application/json" \  -d '{    "model": "minimax/minimax-m3",    "messages": [{"role": "user", "content": "Привет"}]  }'

from openai import OpenAI

client = OpenAI(
    base_url="https://api.hubris.pw/v1",
    api_key="sk-gw-...",
)

response = client.chat.completions.create(
    model="minimax/minimax-m3",
    messages=[{"role": "user", "content": "Привет"}],
)
print(response.choices[0].message.content)

from openai import OpenAIclient = OpenAI(    base_url="https://api.hubris.pw/v1",    api_key="sk-gw-...",)response = client.chat.completions.create(    model="minimax/minimax-m3",    messages=[{"role": "user", "content": "Привет"}],)print(response.choices[0].message.content)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.hubris.pw/v1",
  apiKey: process.env.HUBRIS_API_KEY!,
});

const response = await client.chat.completions.create({
  model: "minimax/minimax-m3",
  messages: [{ role: "user", content: "Привет" }],
});

console.log(response.choices[0].message.content);

import OpenAI from "openai";const client = new OpenAI({  baseURL: "https://api.hubris.pw/v1",  apiKey: process.env.HUBRIS_API_KEY!,});const response = await client.chat.completions.create({  model: "minimax/minimax-m3",  messages: [{ role: "user", content: "Привет" }],});console.log(response.choices[0].message.content);

Другие модели от minimax

MiniMax: Hailuo 2.3

Hailuo 2.3 — это модель для генерации видео от MiniMax. Она принимает текстовые запросы и эталонные изображения в качестве входных данных и генерирует видео, поддерживая рабочие процессы как текст-в-видео, так и изображение-в-видео. Это...

— контекст·13,32 ₽ за секунду

MiniMax: MiniMax M2.7

MiniMax-M2.7 — это крупная языковая модель нового поколения, разработанная для автономной, реальной продуктивности и непрерывного совершенствования. Созданная для активного участия в собственной эволюции, M2.7 интегрирует передовые агентные возможности посредством многоагентного сотрудничества, позволяя ей планировать, выполнять и уточнять сложные задачи в динамичных средах. Обученная для производительности производственного уровня, M2.7 обрабатывает рабочие процессы, такие как отладка в реальном времени, анализ первопричин, финансовое моделирование и полная генерация документов в Word, Excel и PowerPoint. Она демонстрирует высокие результаты в бенчмарках, включая 56,2% на SWE-Pro и 57,0% на Terminal Bench 2, при этом достигая 1495 ELO на GDPval-AA, устанавливая новый стандарт для многоагентных систем, работающих в реальных цифровых рабочих процессах.

205К контекст·от 28,01 ₽/М

MiniMax: MiniMax M2.5

MiniMax-M2.5 — это современная большая языковая модель (SOTA LLM), разработанная для повышения продуктивности в реальных условиях. Обученная в разнообразных и сложных реальных цифровых рабочих средах, M2.5 развивает опыт кодирования M2.1, расширяя его до общей офисной работы, достигая беглости в создании и оперировании файлами Word, Excel и PowerPoint, переключении контекста между различными программными средами и работе в разных командах агентов и людей. Набрав 80,2% на SWE-Bench Verified, 51,3% на Multi-SWE-Bench и 76,3% на BrowseComp, M2.5 также более эффективна по токенам, чем предыдущие поколения, поскольку была обучена оптимизировать свои действия и вывод посредством планирования.

205К контекст·от 16,81 ₽/М

MiniMax: MiniMax M2-her

MiniMax M2-her — это большая языковая модель, ориентированная на диалог, созданная для иммерсивных ролевых игр, чатов, управляемых персонажами, и выразительных многоходовых бесед. Разработанная для поддержания согласованности тона и индивидуальности, она поддерживает богатые роли сообщений (user_system, group, sample_message_user, sample_message_ai) и может учиться на примерах диалогов, чтобы лучше соответствовать стилю и темпу вашего сценария, что делает ее отличным выбором для рассказывания историй, компаньонов и разговорных взаимодействий, где естественный поток и яркое общение имеют наибольшее значение.

66К контекст·от 33,61 ₽/М

MiniMax: MiniMax M2.1

MiniMax-M2.1 — это легковесная, современная большая языковая модель (LLM), оптимизированная для кодирования, агентских рабочих процессов и разработки современных приложений. Имея всего 10 миллиардов активированных параметров, она обеспечивает значительный скачок в реальных возможностях, сохраняя при этом исключительную задержку, масштабируемость и экономическую эффективность. По сравнению со своим предшественником, M2.1 выдает более чистые, лаконичные результаты и более быстрое воспринимаемое время отклика. Она демонстрирует лидирующую многоязычную производительность кодирования в основных системных и прикладных языках, достигая 49,4% на Multi-SWE-Bench и 72,5% на SWE-Bench Multilingual, и служит универсальным «мозгом» агента для IDE, инструментов кодирования и общей помощи. Чтобы избежать снижения производительности этой модели, MiniMax настоятельно рекомендует сохранять рассуждения между ходами. Узнайте больше об использовании `reasoning_details` для передачи рассуждений в нашей .

205К контекст·от 33,61 ₽/М

MiniMax: MiniMax M2

MiniMax-M2 — это компактная, высокоэффективная большая языковая модель, оптимизированная для сквозного кодирования и агентских рабочих процессов. Имея 10 миллиардов активированных параметров (всего 230 миллиардов), она обеспечивает почти передовой интеллект в области общего рассуждения, использования инструментов и выполнения многошаговых задач, сохраняя при этом низкую задержку и эффективность развертывания. Модель превосходно справляется с генерацией кода, редактированием нескольких файлов, циклами компиляции-запуска-исправления и ремонтом, проверенным тестами, демонстрируя высокие результаты на SWE-Bench Verified, Multi-SWE-Bench и Terminal-Bench. Она также конкурентоспособна в агентских оценках, таких как BrowseComp и GAIA, эффективно справляясь с долгосрочным планированием, извлечением информации и восстановлением после ошибок выполнения. По данным [Artificial Analysis](https://artificialanalysis.ai/models/minimax-m2), MiniMax-M2 входит в число лучших моделей с открытым исходным кодом по комплексной интеллектуальной производительности, охватывающей математику, естественные науки и следование инструкциям. Небольшой объем активации обеспечивает быстрый вывод, высокую параллельность и улучшенную экономику единицы, что делает ее хорошо подходящей для крупномасштабных агентов, помощников разработчиков и приложений, ориентированных на рассуждения, которые требуют отзывчивости и экономической эффективности. Чтобы избежать снижения производительности этой модели, MiniMax настоятельно рекомендует сохранять рассуждения между ходами. Узнайте больше об использовании `reasoning_details` для передачи рассуждений в нашей документации.

205К контекст·от 28,57 ₽/М