Z.ai: GLM 5 Turbo

z-ai/glm-5-turbo
z-ai
Выпущена 15 марта 2026 г.|262К контекст|127,33 ₽/М вход|424,42 ₽/М выход

GLM-5 Turbo — это новая модель от Z.ai, разработанная для быстрого вывода и высокой производительности в агент-ориентированных средах, таких как сценарии OpenClaw. Она глубоко оптимизирована для реальных рабочих процессов агентов, включающих длинные цепочки выполнения, с улучшенным разложением сложных инструкций, использованием инструментов, запланированным и постоянным выполнением, а также общей стабильностью при выполнении длительных задач.

Провайдер для Z.ai: GLM 5 Turbo

Hubris маршрутизирует запросы к лучшему доступному провайдеру с автоматическим fallback при сбоях.

z-ai
Контекст
262К
токенов
Макс. ответ
131К
токенов
Вход
127,33 ₽
за 1М токенов
Выход
424,42 ₽
за 1М токенов
Кеш чтение
25,47 ₽
за 1М токенов

Модальности

Вход:ТекстВыход:Текст

Поддерживаемые параметры

frequency_penaltyinclude_reasoninglogit_biasmax_tokensmin_ppresence_penaltyreasoningrepetition_penaltyresponse_formatseedstoptemperaturetool_choicetoolstop_ktop_p

Другие модели от z-ai

Z.ai: GLM 5.1

GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, с особенно заметными улучшениями в решении долгосрочных задач. В отличие от предыдущих моделей, построенных на взаимодействиях минутного уровня, GLM-5.1 может работать независимо и непрерывно над одной задачей более 8 часов, автономно планируя, выполняя и совершенствуя себя на протяжении всего процесса, в конечном итоге предоставляя полные результаты инженерного уровня.

203К контекст·от 103,98 ₽/М

Z.ai: GLM 5

GLM-5 — это флагманская открытая базовая модель Z.ai, разработанная для проектирования сложных систем и долгосрочных рабочих процессов агентов. Созданная для опытных разработчиков, она обеспечивает производительность производственного уровня в крупномасштабных задачах программирования, конкурируя с ведущими закрытыми моделями. Благодаря усовершенствованному агентному планированию, глубокому бэкенд-анализу и итеративной самокоррекции, GLM-5 выходит за рамки генерации кода к полномасштабному построению систем и автономному выполнению.

203К контекст·от 63,66 ₽/М

Z.ai: GLM 4.7 Flash

Будучи современной моделью класса 30B, GLM-4.7-Flash предлагает новую опцию, которая уравновешивает производительность и эффективность. Она дополнительно оптимизирована для использования в агентском кодировании, усиливая возможности кодирования, долгосрочное планирование задач и совместную работу с инструментами, и достигла лидирующих показателей среди открытых моделей того же размера в нескольких текущих публичных рейтингах.

203К контекст·от 6,37 ₽/М

Z.ai: GLM 4.7

GLM-4.7 — это новейшая флагманская модель Z.ai, отличающаяся усовершенствованиями в двух ключевых областях: расширенные возможности программирования и более стабильное многошаговое рассуждение/выполнение. Она демонстрирует значительные улучшения в выполнении сложных агентских задач, обеспечивая при этом более естественное общение и превосходную эстетику внешнего интерфейса.

203К контекст·от 42,44 ₽/М

Z.ai: GLM 4.6V

GLM-4.6V — это большая мультимодальная модель, разработанная для высокоточной визуальной интерпретации и рассуждений в длинном контексте на основе изображений, документов и смешанных медиа. Она поддерживает до 128K токенов, обрабатывает сложные макеты страниц и диаграммы непосредственно в качестве визуальных входных данных и интегрирует нативные мультимодальные вызовы функций для связи восприятия с последующим выполнением инструментов. Модель также обеспечивает чередующуюся генерацию изображений и текста, а также рабочие процессы реконструкции пользовательского интерфейса, включая синтез скриншотов в HTML и итеративное визуальное редактирование.

131К контекст·от 31,83 ₽/М

Z.ai: GLM 4.6

По сравнению с GLM-4.5, это поколение имеет несколько ключевых улучшений: Увеличенное контекстное окно: Контекстное окно было расширено со 128K до 200K токенов, что позволяет модели справляться с более сложными агентными задачами. Превосходная производительность в кодировании: Модель достигает более высоких результатов в бенчмарках по кодированию и демонстрирует лучшую производительность в реальных приложениях, таких как Claude Code, Cline, Roo Code и Kilo Code, включая улучшения в генерации визуально отполированных внешних страниц. Продвинутое рассуждение: GLM-4.6 показывает явное улучшение в производительности рассуждений и поддерживает использование инструментов во время инференса, что приводит к более сильным общим возможностям. Более способные агенты: GLM-4.6 демонстрирует более высокую производительность в использовании инструментов и агентах, основанных на поиске, а также более эффективно интегрируется в агентные фреймворки. Улучшенное написание: Лучше соответствует человеческим предпочтениям в стиле и читабельности, а также более естественно ведет себя в сценариях ролевых игр.

203К контекст·от 45,63 ₽/М