TNG: DeepSeek R1T2 Chimera
tngtech/deepseek-r1t2-chimeraDeepSeek-TNG-R1T2-Chimera — это модель Chimera второго поколения от TNG Tech. Это модель генерации текста с архитектурой mixture-of-experts (MoE) и 671 миллиардом параметров, собранная из контрольных точек DeepSeek-AI R1-0528, R1 и V3-0324 с использованием слияния Assembly-of-Experts. Трехродительская конструкция обеспечивает высокую производительность в задачах рассуждения, работая при этом примерно на 20% быстрее, чем оригинальная R1, и более чем в 2 раза быстрее, чем R1-0528, при использовании vLLM, что обеспечивает выгодное соотношение затрат и интеллекта. Контрольная точка поддерживает контексты до 60 тысяч токенов при стандартном использовании (протестировано до ~130 тысяч) и сохраняет согласованное поведение токена <think>, что делает ее подходящей для анализа длинных контекстов, диалогов и других задач генерации открытого типа.
Провайдер для TNG: DeepSeek R1T2 Chimera
Hubris маршрутизирует запросы через OpenRouter к лучшему доступному провайдеру с автоматическим fallback при сбоях.