Zai (Zhipu AI) — ограничения API, лимиты и тестирование параллельности

Обзор

Zai (Zhipu AI) предоставляет GLM Coding Plan — пакет подписки, разработанный специально для ИИ-программирования. Этот план использует модель GLM-4.7 и предлагает значительно более высокие лимиты использования по сравнению со стандартными планами API.

Пока есть возможность, покупайте со скидкой в -10% по моему промо коду: https://z.ai/subscribe?ic=LHVANAIHDE

Годовые тарифы - очень вкусные! (до 31 января 2026 года акция)

описание изображения

Основная информация

API-эндпоинты

API-эндпоинт для программирования (Coding API Endpoint):

https://api.z.ai/api/coding/paas/v4

Общий API-эндпоинт:

https://api.z.ai/api/paas/v4

Важно: При использовании GLM Coding Plan ОБЯЗАТЕЛЬНО используйте специальный эндпоинт для кодинга. (p.s. вообще его можно юзать и просто так, но это уже другая история)

Лимиты использования (Coding Plan)

GLM Coding Plan предлагает лимиты использования, которые примерно в 3 раза выше, чем у стандартных планов:

План Лимит использования Сравнение
Lite Plan ~120 промтов каждые 5 часов ~3× лимита плана Claude Pro
Pro Plan ~600 промтов каждые 5 часов ~3× лимита плана Claude Max (5x)
Max Plan ~2400 промтов каждые 5 часов ~3× лимита плана Claude Max (20x)

По факту - я не выходил за 1% использования лимитов на своем MAX-тарифе

Важные детали:

  1. Потребление токенов: Каждый промт обычно позволяет сделать 15–20 вызовов модели
  2. Месячная квота: Десятки миллиардов токенов в сумме
  3. Стоимость: Примерно ~1% от стандартной цены API
  4. Сброс: Квота сбрасывается в начале каждого 5-часового цикла
  5. Примечание: Указанные цифры являются оценочными. Фактическое использование может варьироваться в зависимости от:
    • Сложности проекта
    • Размера кодовой базы
    • Включены ли функции автоматического принятия

Цены

На первый месяц дают скидку в -50%, это если покупать тарифы с оплатой по месяцам (без учета скидки):

План Цена
Lite Plan $6/месяц
Pro Plan $30/месяц
Max Plan $60/месяц

Поддерживаемые инструменты

GLM Coding Plan МОЖЕТ использоваться только в определённых инструментах для программирования:

  • Claude Code
  • Cline
  • OpenCode
  • Roo Code
  • Kilo Code
  • Crush
  • Goose
  • И другие

Важно:

  • После подписки, GLM-4.7 автоматически становится доступен в поддерживаемых инструментах
  • Дополнительная настройка не требуется (главное указать правильный coding-endpoint)
  • Если квота исчерпана, она автоматически сбрасывается в начале следующего 5-часового цикла
  • Система НЕ будет потреблять другие пакеты ресурсов или баланс счёта

Использование API против использования Coding Plan

Критическое различие:

  • Пользователи Coding Plan: Могут использовать квоту плана только в поддерживаемых инструментах
  • API-вызовы: Оплачиваются отдельно и НЕ используют квоту Coding Plan
  • Прямые API-вызовы через эндпоинты оплачиваются по тарифам API

Тестирование лимитов API

Я лично (t.me/chernovdev) проводил тесты доступных моделей для coding-плана, коих 4 шт, glm45-air,glm45,glm46,glm47 - в разное время тестов были разные лимиты параллельности, приведу примеры для быстрой air и топ модели:

glm45-air: от 8 до 22 потоков glm47: от 2 до 12 потоков

Все зависит от загруженности китайских серверов, тут как повезет, если не повезет получаете ошибку 429 о том что превышен лимит, повторите позже

Краткое резюме

  • Квота Coding Plan: 120/600/2400 промтов каждые 5 часов (Lite/Pro/Max)
  • Эндпоинт программирования: https://api.z.ai/api/coding/paas/v4
  • Общий эндпоинт: https://api.z.ai/api/paas/v4
  • Цикл сброса: Каждые 5 часов
  • Стоимость: ~1% от стандартной цены API
  • Поддерживаемые инструменты: Claude Code, Cline, OpenCode, Roo Code и др.
  • ⚠️ Важно: Квота Coding Plan работает только в поддерживаемых инструментах
  • ⚠️ Прямой API: Оплачивается отдельно, не использует квоту Coding Plan

Ссылки