Auf dieser Seite werden die Abrechnungseinstellungen beschrieben, die bei Verwendung des standardmäßigen Autoscaling-Verhaltens von Cloud Run gelten. Weitere Informationen zur Abrechnung bei manueller Skalierung finden Sie unter Abrechnungsverhalten bei manueller Skalierung.
Es gibt zwei Abrechnungseinstellungen in Cloud Run-Diensten:
Anfragebasierte Abrechnung (Standard): Cloud Run-Instanzen werden nur dann in Rechnung gestellt, wenn sie Anfragen verarbeiten, starten oder heruntergefahren werden. Weitere Informationen finden Sie unter Instanzlebenszyklus. Diese Einstellung hieß zuvor CPU wird nur während der Anfrageverarbeitung zugewiesen.
Instanzbasierte Abrechnung: Cloud Run-Instanzen werden für den gesamten Lebenszyklus von Instanzen in Rechnung gestellt, auch wenn keine eingehenden Anfragen vorhanden sind. Die instanzbasierte Abrechnung kann für die Ausführung von kurzlebigen Hintergrundaufgaben und anderen asynchronen Verarbeitungsaufgaben nützlich sein. Diese Einstellung hieß zuvor CPU wird immer zugewiesen.
Wenn Sie die anfragebasierte Abrechnung auswählen, werden Ihnen die Kosten pro Anfrage in Rechnung gestellt und nur dann, wenn die Instanz eine Anfrage verarbeitet. Wenn Sie die instanzbasierte Abrechnung auswählen, wird Ihnen der gesamte Lebenszyklus der Instanz in Rechnung gestellt. Weitere Informationen finden Sie in den Cloud Run-Preistabellen.
Recommender prüft automatisch den Traffic, der von Ihrem Cloud Run-Dienst im letzten Monat empfangen wurde, und empfiehlt die Umstellung von abrechnungsbasiert auf Anfragen auf abrechnungsbasiert auf Instanzen, wenn dies günstiger ist.
Auswirkung der CPU-Zuweisung
Die Auswahl einer Abrechnungseinstellung wirkt sich darauf aus, wie die CPU zugewiesen wird.
- Bei der anfragebasierten Abrechnung wird die CPU nur während der Anfrageverarbeitung zugewiesen.
- Bei der instanzbasierten Abrechnung wird die CPU für den gesamten Lebenszyklus der Containerinstanz zugewiesen.
Geeignete Abrechnungseinstellung auswählen
Die Auswahl der geeigneten Abrechnungseinstellung für Ihren Anwendungsfall hängt von mehreren Faktoren ab, z. B. Trafficmuster, Hintergrundausführung und Kosten. Alle Faktoren werden in den folgenden Abschnitten beschrieben.
Überlegungen zu Trafficmustern
- Die anfragebasierte Abrechnung wird empfohlen, wenn der eingehende Traffic sporadisch, stoßweise oder in kurzen Abständen auftritt.
- Die instanzbasierte Abrechnung wird empfohlen, wenn eingehender Traffic stabil ist und nur langsam variiert.
Überlegungen zur Hintergrundausführung
Wenn Sie die instanzbasierte Abrechnung auswählen, wird die CPU auch außerhalb der Anfrageverarbeitung zugewiesen. So können Sie nach der Rückgabe von Antworten kurzlebige Hintergrundaufgaben und andere asynchrone Verarbeitungsaufgaben ausführen. Beispiel:
- Nutzung von Monitoring-Agents wie OpenTelemetry, die im Hintergrund laufen können.
- Go-Routinen von Go, asynchrone Node.js, Java-Threads und Kotlin-Ko-Routinen verwenden.
- Anwendungs-Frameworks, die integrierte Planungs-/Hintergrundfunktionen nutzen.
Inaktive Instanzen, einschließlich solcher, die mithilfe von Mindestinstanzen einsatzbereit gehalten werden, können jederzeit heruntergefahren werden. Wenn Sie ausstehende Aufgaben ausführen müssen, bevor der Container beendet wird, können Sie SIGTERM abfangen, um einer Instanz 10 Sekunden Zeit zu geben, bevor sie angehalten wird.
Ziehen Sie die Verwendung von Cloud Tasks für die Ausführung asynchroner Aufgaben in Betracht. Cloud Tasks wiederholt fehlgeschlagene Aufgaben automatisch und unterstützt Laufzeiten von bis zu 30 Minuten.
Kostengesichtspunkte
Wenn Sie die anfragebasierte Abrechnung verwenden, kann die instanzbasierte Abrechnung kostengünstiger sein, wenn:
- Ihr Cloud Run-Dienst verarbeitet eine hohe Anzahl aktueller Anfragen mit einer relativ konstanten Rate.
- Wenn Sie sich den Messwert „Anzahl der Instanzen“ ansehen, werden nicht viele „inaktive“ Instanzen angezeigt.
Mit dem Preisrechner können Sie die Kostenunterschiede schätzen.
Überlegungen zum Autoscaling
Cloud Run skaliert die Anzahl der Containerinstanzen standardmäßig automatisch.
Bei einem Dienst, für den die anfragebasierte Abrechnung festgelegt ist, wird die Anzahl der Instanzen in Cloud Run nur während der Anfrageverarbeitung automatisch auf Grundlage der CPU-Auslastung skaliert.
Bei einem Dienst, für den die instanzbasierte Abrechnung festgelegt ist, skaliert Cloud Run die Anzahl der Instanzen automatisch basierend auf der CPU-Auslastung für den gesamten Lebenszyklus der Containerinstanz, außer beim Skalieren auf und von null, wo nur Anfragen verwendet werden.
Weitere Überlegungen zur manuellen Skalierung anstelle der Cloud Run-Autoscaling-Funktion finden Sie unter Manuelle Skalierung.
Hinweise zur instanzbasierten Abrechnung
Selbst wenn die Abrechnungseinstellung auf instanzbasierte Abrechnung festgelegt ist, ist das Autoscaling von Cloud Run noch in Kraft und kann Instanzen beenden, wenn sie nicht für die Verarbeitung des eingehenden Traffics oder der aktuellen CPU-Auslastung außerhalb von Anfragen benötigt werden. Eine Instanz bleibt nach der Verarbeitung einer Anfrage nie länger als 15 Minuten inaktiv, es sei denn, sie bleibt mit Mindestinstanzen aktiv.
Die Kombination der instanzbasierten Abrechnung mit einer Reihe von Mindestinstanzen führt dazu, dass eine Reihe von Instanzen mit vollem Zugriff auf CPU-Ressourcen ausgeführt wird. Dadurch werden Hintergrundverarbeitungsanwendungsfälle ermöglicht. Wenn Sie dieses Muster verwenden, wendet Cloud Run das Instanz-Autoscaling auch dann an, wenn ein Dienst CPU außerhalb von Anfragen verwendet.
Wenn Sie Systemdiagnoseprüfungen verwenden, müssen Sie für jede Prüfung die instanzbasierte Abrechnung verwenden. Weitere Informationen finden Sie unter Systemdiagnoseprüfungen für Container.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Konfigurieren und Bereitstellen von Cloud Run-Diensten benötigen:
-
Cloud Run-Entwickler (
roles/run.developer
) im Cloud Run-Dienst -
Dienstkontonutzer (
roles/iam.serviceAccountUser
) für die Dienstidentität
Eine Liste der IAM-Rollen und -Berechtigungen im Zusammenhang mit Cloud Run finden Sie unter IAM-Rollen für Cloud Run und IAM-Berechtigungen für Cloud Run. Wenn Ihr Cloud Run-Dienst mitGoogle Cloud APIs wie Cloud-Clientbibliotheken verknüpft ist, lesen Sie die Konfigurationsanleitung für Dienstidentitäten. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Bereitstellungsberechtigungen und Zugriff verwalten.
Abrechnung einrichten und aktualisieren
Jede Konfigurationsänderung führt zur Erstellung einer neuen Überarbeitung. Für nachfolgende Überarbeitungen gilt automatisch dieselbe Konfigurationseinstellung, sofern Sie sie nicht explizit aktualisieren.
Wenn Sie die instanzbasierte Abrechnung auswählen, müssen Sie mindestens 512 MiB Arbeitsspeicher angeben.
Sie können die Abrechnungseinstellung über die Google Cloud Console, die gcloud CLI oder eine YAML-Datei ändern, wenn Sie einen neuen Dienst erstellen oder eine neue Überarbeitung bereitstellen:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf:
Wählen Sie im Menü Dienste aus und klicken Sie auf Container bereitstellen, um einen neuen Dienst zu konfigurieren. Wenn Sie einen vorhandenen Dienst konfigurieren möchten, klicken Sie auf den Dienst und dann auf Neue Überarbeitung bearbeiten und bereitstellen.
Wenn Sie einen neuen Dienst konfigurieren, füllen Sie die Seite mit den anfänglichen Diensteinstellungen aus.
Wählen Sie unter Abrechnung eine Abrechnungseinstellung aus. Wählen Sie anfragebasierte Abrechnung aus, damit Ihre Instanzen nur während der Anfrageverarbeitung abgerechnet werden. Wählen Sie instanzbasierte Abrechnung für Ihre Instanzen aus, damit Ihnen der gesamte Lebenszyklus von Instanzen in Rechnung gestellt wird.
Klicken Sie auf Erstellen oder Bereitstellen.
gcloud
Sie können die Abrechnungseinstellung aktualisieren. So legen Sie die instanzbasierte Abrechnung für einen bestimmten Dienst fest:
gcloud run services update SERVICE --no-cpu-throttling
Ersetzen Sie SERVICE durch den Namen Ihres Dienstes.
So legen Sie die anfragebasierte Abrechnung fest:
gcloud run services update SERVICE --cpu-throttling
Sie können die Abrechnungseinstellung auch während der Bereitstellung festlegen. So stellen Sie die Abrechnungseinstellung auf instanzbasierte Abrechnung um:
gcloud run deploy --image IMAGE_URL --no-cpu-throttling
So stellen Sie die Abrechnungseinstellung auf anfragebasierte Abrechnung um:
gcloud run deploy --image IMAGE_URL --cpu-throttling
Ersetzen Sie IMAGE_URL durch einen Verweis auf das Container-Image, z. B. us-docker.pkg.dev/cloudrun/container/hello:latest
. Wenn Sie Artifact Registry verwenden, muss das Repository REPO_NAME bereits erstellt sein. Die URL hat die Form LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
.
YAML
Wenn Sie einen neuen Dienst erstellen, überspringen Sie diesen Schritt. Wenn Sie einen vorhandenen Dienst aktualisieren, laden Sie die zugehörige YAML-Konfiguration herunter:
gcloud run services describe SERVICE --format export > service.yaml
Aktualisieren Sie das Attribut
cpu
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: annotations: run.googleapis.com/cpu-throttling: 'BOOLEAN' name: REVISION
Ersetzen
- SERVICE durch den Namen Ihres Cloud Run-Dienstes
- BOOLEAN mit
true
, um die anfragebasierte Abrechnung festzulegen, oderfalse
, um die instanzbasierte Abrechnung festzulegen. - REVISION durch einen neuen Überarbeitungsnamen oder löschen (falls vorhanden). Wenn Sie einen neuen Überarbeitungsnamen angeben, muss er die folgenden Kriterien erfüllen:
- Beginnt mit
SERVICE-
- Enthält nur Kleinbuchstaben, Ziffern und
-
- Endet nicht mit
-
- Darf nicht mehr als 63 Zeichen enthalten
- Beginnt mit
Erstellen oder aktualisieren Sie den Dienst mit dem folgenden Befehl:
gcloud run services replace service.yaml
Terraform
Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.
Fügen Sie einergoogle_cloud_run_v2_service
-Ressource in Ihrer Terraform-Konfiguration Folgendes hinzu:Abrechnungseinstellungen ansehen
So rufen Sie die aktuellen Abrechnungseinstellungen für Ihren Cloud Run-Dienst auf:
Console
Rufen Sie in der Google Cloud Console Cloud Run auf:
Klicken Sie auf den gewünschten Dienst, um die Seite Dienstdetails zu öffnen.
Klicken Sie auf den Tab Überarbeitungen.
Im Detailbereich auf der rechten Seite ist die Abrechnungseinstellung auf dem Tab Allgemein aufgeführt.
gcloud
Verwenden Sie den folgenden Befehl:
gcloud run services describe SERVICE
Suchen Sie in der zurückgegebenen Konfiguration nach der Abrechnungseinstellung.