Лимиты и квоты
Лимиты запросов (RPM)
Лимиты на количество запросов в минуту (RPM) определяют, как интенсивно вы можете использовать наш API. Система лимитов разработана так, чтобы вознаграждать активных пользователей: чем больше общая сумма ваших пополнений, тем выше ваш лимит.
Основные принципы
- Лимит зависит от суммы пополнений: Ваш RPM напрямую связан с общей суммой, на которую вы пополняли баланс API ключа за всё время.
- Лимит только растет: Ваш лимит RPM может только увеличиваться при достижении нового порога пополнений. Он никогда не будет снижен.
- Лимиты привязаны к ключу: История пополнений и соответствующий лимит RPM учитываются для каждого API ключа отдельно. Если вы используете несколько ключей, их истории пополнений не суммируются.
Совет
Если вам нужны высокие лимиты RPM, рекомендуется пополнять один и тот же API ключ, а не создавать новые. Инструкция по пополнению.
Таблица лимитов
| Общая сумма пополнений (за всё время) | Лимит запросов в минуту (RPM) |
|---|---|
| ≥ 50 000 ₽ | 600 |
| ≥ 40 000 ₽ | 500 |
| ≥ 30 000 ₽ | 400 |
| ≥ 20 000 ₽ | 300 |
| ≥ 10 000 ₽ | 200 |
| ≥ 5 000 ₽ | 100 |
| ≥ 3 750 ₽ | 75 |
| ≥ 2 500 ₽ | 55 |
| ≥ 1 250 ₽ | 35 |
| < 1 250 ₽ | 10 |
Что такое RPM коэффициент?
RPM коэффициент — это специальный множитель, который мы применяем к отдельным моделям для корректировки доступного количества запросов. Этот параметр позволяет индивидуально увеличивать или уменьшать пропускную способность для конкретной нейросети, не меняя общий уровень вашего аккаунта.
Принцип работы
Коэффициент влияет на лимит запросов исключительно для выбранной модели. Итоговое количество доступных запросов в минуту рассчитывается как произведение вашего текущего базового лимита (зависящего от суммы пополнений) на RPM коэффициент модели.
Примеры расчета
Предположим, ваш базовый лимит составляет 100 RPM:
- Понижающий коэффициент (0.5): Если у модели установлен коэффициент 0.5, ваш лимит к ней составит 50 запросов в минуту (100 * 0.5 = 50).
- Повышающий коэффициент (1.5): Если у модели установлен коэффициент 1.5, ваш лимит к ней увеличится до 150 запросов в минуту (100 * 1.5 = 150).
Таким образом, для более «легких» или менее нагруженных моделей лимит может быть выше стандартного, а для ресурсоемких или перегруженных — ниже.
Что происходит при превышении лимита?
Если вы отправите больше запросов, чем позволяет ваш текущий лимит RPM, API вернет ошибку с кодом состояния 429 Too Many Requests. В этом случае вам необходимо снизить частоту отправки запросов и повторить попытку позже.
Запросы в секунду (RPS)
В нашем API нет жесткого лимита на количество запросов в секунду (RPS). Однако частые и резкие пиковые нагрузки могут временно снизить приоритет обработки ваших запросов, чтобы обеспечить стабильность системы для всех пользователей. Рекомендуется распределять запросы равномерно внутри минуты.