Zai (Zhipu AI) — ограничения API, лимиты и тестирование параллельности
Обзор
Zai (Zhipu AI) предоставляет GLM Coding Plan — пакет подписки, разработанный специально для ИИ-программирования. Этот план использует модель GLM-4.7 и предлагает значительно более высокие лимиты использования по сравнению со стандартными планами API.
Пока есть возможность, покупайте со скидкой в -10% по моему промо коду: https://z.ai/subscribe?ic=LHVANAIHDE
Годовые тарифы - очень вкусные! (до 31 января 2026 года акция)

Основная информация
API-эндпоинты
API-эндпоинт для программирования (Coding API Endpoint):
https://api.z.ai/api/coding/paas/v4
Общий API-эндпоинт:
https://api.z.ai/api/paas/v4
Важно: При использовании GLM Coding Plan ОБЯЗАТЕЛЬНО используйте специальный эндпоинт для кодинга. (p.s. вообще его можно юзать и просто так, но это уже другая история)
Лимиты использования (Coding Plan)
GLM Coding Plan предлагает лимиты использования, которые примерно в 3 раза выше, чем у стандартных планов:
| План | Лимит использования | Сравнение |
|---|---|---|
| Lite Plan | ~120 промтов каждые 5 часов | ~3× лимита плана Claude Pro |
| Pro Plan | ~600 промтов каждые 5 часов | ~3× лимита плана Claude Max (5x) |
| Max Plan | ~2400 промтов каждые 5 часов | ~3× лимита плана Claude Max (20x) |
По факту - я не выходил за 1% использования лимитов на своем MAX-тарифе
Важные детали:
- Потребление токенов: Каждый промт обычно позволяет сделать 15–20 вызовов модели
- Месячная квота: Десятки миллиардов токенов в сумме
- Стоимость: Примерно ~1% от стандартной цены API
- Сброс: Квота сбрасывается в начале каждого 5-часового цикла
- Примечание: Указанные цифры являются оценочными. Фактическое использование может варьироваться в зависимости от:
- Сложности проекта
- Размера кодовой базы
- Включены ли функции автоматического принятия
Цены
На первый месяц дают скидку в -50%, это если покупать тарифы с оплатой по месяцам (без учета скидки):
| План | Цена |
|---|---|
| Lite Plan | $6/месяц |
| Pro Plan | $30/месяц |
| Max Plan | $60/месяц |
Поддерживаемые инструменты
GLM Coding Plan МОЖЕТ использоваться только в определённых инструментах для программирования:
- Claude Code
- Cline
- OpenCode
- Roo Code
- Kilo Code
- Crush
- Goose
- И другие
Важно:
- После подписки, GLM-4.7 автоматически становится доступен в поддерживаемых инструментах
- Дополнительная настройка не требуется (главное указать правильный coding-endpoint)
- Если квота исчерпана, она автоматически сбрасывается в начале следующего 5-часового цикла
- Система НЕ будет потреблять другие пакеты ресурсов или баланс счёта
Использование API против использования Coding Plan
Критическое различие:
- Пользователи Coding Plan: Могут использовать квоту плана только в поддерживаемых инструментах
- API-вызовы: Оплачиваются отдельно и НЕ используют квоту Coding Plan
- Прямые API-вызовы через эндпоинты оплачиваются по тарифам API
Тестирование лимитов API
Я лично (t.me/chernovdev) проводил тесты доступных моделей для coding-плана, коих 4 шт, glm45-air,glm45,glm46,glm47 - в разное время тестов были разные лимиты параллельности, приведу примеры для быстрой air и топ модели:
glm45-air: от 8 до 22 потоков glm47: от 2 до 12 потоков
Все зависит от загруженности китайских серверов, тут как повезет, если не повезет получаете ошибку 429 о том что превышен лимит, повторите позже
Краткое резюме
- ✅ Квота Coding Plan: 120/600/2400 промтов каждые 5 часов (Lite/Pro/Max)
- ✅ Эндпоинт программирования:
https://api.z.ai/api/coding/paas/v4 - ✅ Общий эндпоинт:
https://api.z.ai/api/paas/v4 - ✅ Цикл сброса: Каждые 5 часов
- ✅ Стоимость: ~1% от стандартной цены API
- ✅ Поддерживаемые инструменты: Claude Code, Cline, OpenCode, Roo Code и др.
- ⚠️ Важно: Квота Coding Plan работает только в поддерживаемых инструментах
- ⚠️ Прямой API: Оплачивается отдельно, не использует квоту Coding Plan
