hubris
Логотип NVIDIA — провайдер модели NVIDIA: Nemotron 3 Nano 30B A3B (free)

NVIDIA: Nemotron 3 Nano 30B A3B (free)

nvidia/nemotron-3-nano-30b-a3b:free
nvidia
Выпущена 14 декабря 2025 г.|256К контекст|бесплатно/М вход|бесплатно/М выход

NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью, предназначенная для разработчиков, создающих специализированные агентные системы ИИ. Модель полностью открыта, с открытыми весами, наборами данных и рецептами, чтобы разработчики могли легко настраивать, оптимизировать и развертывать модель на своей инфраструктуре для обеспечения максимальной конфиденциальности и безопасности.

⚠ Бесплатная витрина модели

Лимиты RPM/RPD выставляет провайдер модели, не Hubris — конкретные значения провайдер не публикует. При 429 повторите запрос с экспоненциальной задержкой либо переключитесь на платную версию модели. Подробнее.

Провайдер для NVIDIA: Nemotron 3 Nano 30B A3B (free)

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

nvidia
Контекст
256К
токенов
Макс. ответ
Вход
бесплатно
за 1М токенов
Выход
бесплатно
за 1М токенов

Модальности

Вход:ТекстВыход:Текст

Поддерживаемые параметры

include_reasoningmax_tokensreasoningseedtemperaturetool_choicetoolstop_p

Другие модели от nvidia

NVIDIA: Nemotron 3.5 Content Safety (free)

NVIDIA Nemotron 3.5 Content Safety — это компактная 4B-параметрическая мультимодальная модель-ограничитель от NVIDIA, доработанная на основе Google Gemma-3-4B. Она модерирует как входные данные, так и ответы от LLM и VLM, принимая текстовые и графические входные данные и возвращая текстовый вывод: классификацию пользовательского запроса и ответа как безопасного/небезопасного, метки категорий безопасности и необязательный трассировочный вывод. Она поддерживает 12 языков с контекстным окном до 128K токенов. Модель подходит для модерации запросов и ответов, классификации контента, конвейеров безопасности и корпоративных AI-ограничителей с принудительным применением политик, а также включает переключаемый режим рассуждений. Она является частью семейства открытых моделей NVIDIA Nemotron для агентного ИИ.

128К контекст·от бесплатно/М

NVIDIA: Nemotron 3 Ultra

NVIDIA Nemotron 3 Ultra — это открытая модель от NVIDIA для рассуждений и оркестрации, с 55 млрд активных параметров из 550 млрд общих (MoE). Построенная на гибридной архитектуре Transformer-Mamba mixture-of-experts, она поддерживает текстовый ввод и вывод с контекстным окном до 1M токенов. Модель подходит для длительных агентных рабочих процессов, включая оркестрацию агентов, кодирующих агентов, глубокие исследования и сложные корпоративные задачи. Она особенно сильна в многошаговых рассуждениях и планировании, с высокопроизводительным выводом, разработанным для высокообъемных агентных конвейеров. Модель является частью семейства открытых моделей NVIDIA Nemotron для агентного ИИ.

1.0М контекст·от 53,64 ₽/М

NVIDIA: Nemotron 3 Ultra (free)

NVIDIA Nemotron 3 Ultra — это открытая модель от NVIDIA для рассуждений и оркестрации, с 55 миллиардами активных параметров из 550 миллиардов общих (MoE). Построенная на гибридной архитектуре Transformer-Mamba mixture-of-experts, она поддерживает текстовый ввод и вывод с контекстным окном до 1 миллиона токенов. Она подходит для длительных агентских рабочих процессов, включая оркестрацию агентов, агентов для кодирования, глубокие исследования и сложные корпоративные задачи. Модель особенно сильна в многошаговых рассуждениях и планировании, с высокой пропускной способностью вывода, разработанной для высокообъемных агентских конвейеров. Она является частью семейства открытых моделей NVIDIA Nemotron для агентского ИИ.

1.0М контекст·от бесплатно/М

NVIDIA: Nemotron 3 Nano Omni (free)

NVIDIA Nemotron™ 3 Nano Omni — это открытая мультимодальная модель 30B-A3B, разработанная для функционирования в качестве субагента восприятия и контекста в корпоративных агентских системах. Она принимает текстовые, графические, видео- и аудиовходы и выдает текстовый вывод, позволяя агентам воспринимать и рассуждать в различных модальностях за один цикл вывода. Построенная на гибридной архитектуре MoE Transformer-Mamba с видеослоями Conv3D и Efficient Video Sampling (EVS), она обеспечивает примерно в 2 раза более высокую пропускную способность и в 2,5 раза меньшие вычислительные затраты для обработки видео по сравнению с отдельными конвейерами зрения + речи. Она поддерживает длину контекста до 300K и бюджет рассуждений 16 384, с расширенным мышлением, включенным через параметр `reasoning.enabled`.

256К контекст·от бесплатно/М

NVIDIA: Nemotron 3 Super

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Построенная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с предсказанием нескольких токенов (MTP), она обеспечивает более чем на 50% более высокую генерацию токенов по сравнению с ведущими открытыми моделями. Модель имеет контекстное окно в 1 миллион токенов для долгосрочной когерентности агентов, кросс-документного рассуждения и многошагового планирования задач. Latent MoE позволяет вызывать 4 экспертов при стоимости вывода всего одного, улучшая интеллект и обобщение. Обучение с подкреплением в нескольких средах (более 10) обеспечивает ведущую точность в бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая, с весами, наборами данных и рецептами под лицензией NVIDIA Open License, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать ее где угодно — от рабочей станции до облака.

1.0М контекст·от 9,12 ₽/М

NVIDIA: Nemotron 3 Super (free)

NVIDIA Nemotron 3 Super — это открытая гибридная MoE-модель со 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Построенная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с предсказанием нескольких токенов (MTP), она обеспечивает более чем на 50% более высокую генерацию токенов по сравнению с ведущими открытыми моделями. Модель имеет контекстное окно в 1 миллион токенов для долгосрочной согласованности агентов, кросс-документного рассуждения и многошагового планирования задач. Латентная MoE позволяет вызывать 4 экспертов при стоимости вывода только одного, улучшая интеллект и обобщение. Обучение с подкреплением в нескольких средах (более 10) обеспечивает ведущую точность в бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified. Полностью открытая, с весами, наборами данных и рецептами под лицензией NVIDIA Open License, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать её где угодно — от рабочей станции до облака.

1.0М контекст·от бесплатно/М