Fehlercode 429

Wenn die Anzahl der an ein Modell gesendeten Anfragen die verfügbare Verarbeitungskapazität überschreitet, gibt Vertex AI den Fehlercode 429 zurück, der angibt, dass die Ressource erschöpft ist. Die spezifische Fehlermeldung und die Lösung hängen davon ab, ob Sie den Pay-as-you-go-Dienst verwenden oder den bereitgestellten Durchsatz erworben haben.

429-Fehler

In der folgenden Tabelle wird verglichen, wie der Fehler 429 im Rahmen des Pay-as-you-go- und des bereitgestellten Durchsatzkontingents behandelt wird.

Funktion Pay as you go Bereitgestellter Durchsatz
Fehlermeldung Resource exhausted, please try again later. Too many requests. Exceeded the Provisioned Throughput.
Ursache Die Anzahl der Anfragen übersteigt die verfügbare Kapazität im freigegebenen Ressourcenpool. Die Anzahl der Anfragen überschreitet die reservierte Durchsatzkapazität.
Auswirkungen auf das SLA Anfragen, die einen 429-Fehler zurückgeben, werden nicht auf Ihre Fehlerrate angerechnet, wie im Service Level Agreement (SLA) beschrieben. Fehler bei einer Nutzung, die unter dem gekauften Durchsatz liegt, werden als 5XX zurückgegeben und auf das SLA angerechnet. Fehler bei einer Nutzung, die über Ihrem erworbenen Durchsatz liegt, werden als „Pay-as-you-go“ behandelt und nicht auf das SLA angerechnet.

Mit einem Abo für bereitgestellten Durchsatz reservieren Sie einen bestimmten Durchsatz für Ihre Modelle. Wenn Sie kein Abo haben und freigegebene Ressourcen nicht verfügbar sind, erhalten Sie den Fehler 429. Auch wenn Sie keine Kapazität reserviert haben, können Sie Ihren Antrag noch einmal senden.

Bei Projekten mit bereitgestelltem Durchsatz reserviert Vertex AI den gekauften Durchsatz für die Nutzung Ihres Projekts. Wenn Sie weniger als den gekauften Betrag nutzen, werden Fehler, die andernfalls als 429 klassifiziert würden, als 5XX zurückgegeben und auf die SLA-Fehlerrate angerechnet. Wenn Sie den gekauften Betrag überschreiten, werden die zusätzlichen Anfragen auf Abruf als „Pay-as-you-go“ verarbeitet.

429-Fehler beheben

Die Schritte zur Behebung eines 429-Fehlers variieren je nach Ihrem Kontingentrahmen.

Pay as you go

Im Rahmen des Pay-per-Use-Kontingents haben Sie folgende Möglichkeiten, 429-Fehler zu beheben:

  • Globalen Endpunkt verwenden: Verwenden Sie nach Möglichkeit den globalen Endpunkt anstelle eines regionalen Endpunkts.
  • Implementieren Sie eine Wiederholungsstrategie: Verwenden Sie den abgeschnittenen exponentiellen Backoff, um Anfragen zu wiederholen.
  • Kontingenterhöhung beantragen: Wenn für Ihr Modell Kontingente verwendet werden, können Sie eine Kontingenterhöhung beantragen.
  • Traffic glätten: Wenn für Ihr Modell das Dynamic Shared Quota (DSQ) verwendet wird, kann es hilfreich sein, den Traffic zu glätten und große Spitzen zu reduzieren. Weitere Informationen finden Sie unter Dynamisches freigegebenes Kontingent.
  • Bereitgestellten Durchsatz abonnieren: Wenn Sie eine gleichmäßigere Dienstqualität wünschen, abonnieren Sie den bereitgestellten Durchsatz. Weitere Informationen finden Sie unter Bereitgestellter Durchsatz.

Bereitgestellter Durchsatz

So beheben Sie einen 429-Fehler, wenn Sie ein Abo mit bereitgestelltem Durchsatz haben:

  • On-Demand-Verarbeitung zulassen: Verwenden Sie das Standardverhalten, indem Sie in Ihren Vorhersageanfragen keinen Header festlegen. Überschreitungen werden auf Abruf verarbeitet und als „Pay-as-you-go“ abgerechnet.
  • Reservierte Kapazität erhöhen: Erhöhen Sie die Anzahl der GSUs in Ihrem Abo mit bereitgestelltem Durchsatz.

Nächste Schritte