Z.ai: GLM 5 Turbo

z-ai/glm-5-turbo

Выпущена 15 марта 2026 г.|203К контекст|135,55 ₽/М вход|451,84 ₽/М выход

GLM-5 Turbo — это новая модель от Z.ai, разработанная для быстрого вывода и высокой производительности в агент-ориентированных средах, таких как сценарии OpenClaw. Она глубоко оптимизирована для реальных рабочих процессов агентов, включающих длинные цепочки выполнения, с улучшенным разложением сложных инструкций, использованием инструментов, запланированным и постоянным выполнением, а также общей стабильностью при выполнении длительных задач.

Провайдер для Z.ai: GLM 5 Turbo

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

z-ai

Latency

—

Throughput

—

Uptime

—

Контекст

203К

токенов

Макс. ответ

131К

токенов

Вход

135,55 ₽

за 1М токенов

Выход

451,84 ₽

за 1М токенов

Кеш чтение

27,11 ₽

за 1М токенов

Модальности

Вход:ТекстВыход:Текст

Провайдеры

Запросы обслуживает один из провайдеров ниже — маршрутизация автоматически выбирает оптимального по доступности и скорости в момент запроса. Итоговая стоимость зависит от того, какой провайдер обслужил запрос, и от попадания в кэш: при повторяющемся контексте вход тарифицируется по цене чтения кэша — до 60–80 % дешевле. Цены — в рублях за 1 млн токенов.


Z.AI	135,55 ₽	451,84 ₽	27,11 ₽	—	100,0 %

Поддерживаемые параметры

include_reasoningmax_tokensreasoningresponse_formattemperaturetool_choicetoolstop_ktop_p

Тарификация для Z.ai: GLM 5 Turbo

Цены в рублях за 1 млн токенов. Списание — за реальные токены, без подписок.

Тип	Цена в ₽	Единица
Вход	135,55 ₽	за 1М токенов
Выход	451,84 ₽	за 1М токенов
Кэш: чтение	27,11 ₽	за 1М токенов

Пример кода и API для Z.ai: GLM 5 Turbo

Hubris — OpenAI-совместимый API. Используйте любой OpenAI SDK, поменяв только base URL и ключ.

Получить API-ключ

curl https://api.hubris.pw/v1/chat/completions \
  -H "Authorization: Bearer sk-gw-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "z-ai/glm-5-turbo",
    "messages": [{"role": "user", "content": "Привет"}]
  }'

curl https://api.hubris.pw/v1/chat/completions \  -H "Authorization: Bearer sk-gw-..." \  -H "Content-Type: application/json" \  -d '{    "model": "z-ai/glm-5-turbo",    "messages": [{"role": "user", "content": "Привет"}]  }'

from openai import OpenAI

client = OpenAI(
    base_url="https://api.hubris.pw/v1",
    api_key="sk-gw-...",
)

response = client.chat.completions.create(
    model="z-ai/glm-5-turbo",
    messages=[{"role": "user", "content": "Привет"}],
)
print(response.choices[0].message.content)

from openai import OpenAIclient = OpenAI(    base_url="https://api.hubris.pw/v1",    api_key="sk-gw-...",)response = client.chat.completions.create(    model="z-ai/glm-5-turbo",    messages=[{"role": "user", "content": "Привет"}],)print(response.choices[0].message.content)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.hubris.pw/v1",
  apiKey: process.env.HUBRIS_API_KEY!,
});

const response = await client.chat.completions.create({
  model: "z-ai/glm-5-turbo",
  messages: [{ role: "user", content: "Привет" }],
});

console.log(response.choices[0].message.content);

import OpenAI from "openai";const client = new OpenAI({  baseURL: "https://api.hubris.pw/v1",  apiKey: process.env.HUBRIS_API_KEY!,});const response = await client.chat.completions.create({  model: "z-ai/glm-5-turbo",  messages: [{ role: "user", content: "Привет" }],});console.log(response.choices[0].message.content);

Другие модели от z-ai

Z.ai: GLM 5.2

GLM 5.2 — это крупномасштабная модель рассуждений от Z.ai. Она поддерживает ввод и вывод текста с контекстным окном в 1M токенов и подходит для долгосрочных рабочих процессов агентов, программной инженерии на уровне проектов и сложной многошаговой автоматизации. Поддерживаются уровни рассуждений high и xhigh; xhigh соответствует максимальному уровню рассуждений. Модель особенно сильна в кодировании и использовании инструментов в рамках длительных задач, способна поддерживать инженерный контекст и последовательно следовать стандартам на протяжении всего цикла разработки, от требований до многоплатформенного развертывания, в рамках одной задачи.

1.0М контекст·от 85,86 ₽/М

Z.ai: GLM 5.1

GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, с особенно заметными улучшениями в решении долгосрочных задач. В отличие от предыдущих моделей, построенных на взаимодействиях минутного уровня, GLM-5.1 может работать независимо и непрерывно над одной задачей более 8 часов, автономно планируя, выполняя и совершенствуя себя на протяжении всего процесса, в конечном итоге предоставляя полные результаты инженерного уровня.

205К контекст·от 109,12 ₽/М

Z.ai: GLM 5V Turbo

GLM-5V-Turbo — это первая нативная мультимодальная базовая модель агента от Z.ai, созданная для визуального кодирования и задач, управляемых агентами. Она нативно обрабатывает изображения, видео и текстовые входные данные, превосходно справляется с долгосрочным планированием, сложным кодированием и выполнением задач, а также беспрепятственно работает с агентами для завершения полного цикла «воспринимать → планировать → выполнять».

203К контекст·от 135,55 ₽/М

Z.ai: GLM 5

GLM-5 — это флагманская открытая базовая модель Z.ai, разработанная для проектирования сложных систем и долгосрочных рабочих процессов агентов. Созданная для опытных разработчиков, она обеспечивает производительность производственного уровня в крупномасштабных задачах программирования, конкурируя с ведущими закрытыми моделями. Благодаря усовершенствованному агентному планированию, глубокому бэкенд-анализу и итеративной самокоррекции, GLM-5 выходит за рамки генерации кода к полномасштабному построению систем и автономному выполнению.

205К контекст·от 107,31 ₽/М

Z.ai: GLM 4.7 Flash

Будучи современной моделью класса 30B, GLM-4.7-Flash предлагает новую опцию, которая уравновешивает производительность и эффективность. Она дополнительно оптимизирована для использования в агентском кодировании, усиливая возможности кодирования, долгосрочное планирование задач и совместную работу с инструментами, и достигла лидирующих показателей среди открытых моделей того же размера в нескольких текущих публичных рейтингах.

203К контекст·от 6,78 ₽/М

Z.ai: GLM 4.7

GLM-4.7 — это новейшая флагманская модель Z.ai, отличающаяся усовершенствованиями в двух ключевых областях: расширенные возможности программирования и более стабильное многошаговое рассуждение/выполнение. Она демонстрирует значительные улучшения в выполнении сложных агентских задач, обеспечивая при этом более естественное общение и превосходную эстетику внешнего интерфейса.

205К контекст·от 45,18 ₽/М