Creare un modello di runtime
Questa pagina mostra come creare un modello di runtime in Colab Enterprise.
Per eseguire il codice nel notebook, utilizzi una risorsa di calcolo chiamata runtime. Puoi utilizzare il runtime predefinito o un runtime creato da un modello di runtime. Creando un modello di runtime, puoi configurarlo per ottimizzare le prestazioni, i costi e altre caratteristiche di un runtime in base alle tue esigenze.
Scopri di più su runtime e modelli di runtime.
Prima di iniziare
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI, Dataform, and Compute Engine APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI, Dataform, and Compute Engine APIs.
-
Nella console Google Cloud , vai alla pagina Modelli di runtime di Colab Enterprise.
-
Fai clic su
Nuovo modello.Viene visualizzata la finestra di dialogo Crea nuovo modello di runtime.
-
Nella sezione Nozioni di base sul runtime, inserisci un Nome visualizzato.
-
Nel menu Regione, seleziona la regione in cui vuoi il modello di runtime.
-
(Facoltativo) Aggiungi una Descrizione del modello di runtime.
-
(Facoltativo) Per aggiungere un'etichetta, fai clic su
Aggiungi etichetta, e poi inserisci una coppia Chiave e Valore. Per aggiungere altre etichette, ripeti questo passaggio. -
Fai clic su Continua.
-
Nella sezione Configura calcolo, nel menu Tipo di macchina, seleziona un tipo di macchina. Per informazioni sui tipi di macchine, consulta la guida alle risorse e al confronto per le famiglie di macchine.
Se selezioni un tipo di macchina con GPU, seleziona Tipo di acceleratore e Conteggio acceleratori. Se non riesci a selezionare il numero di GPU che vuoi, potresti dover aumentare la quota. Consulta Richiedi un aggiustamento delle quote.
-
Nel menu Tipo di disco di dati, seleziona un tipo di disco.
-
Nel campo Dimensione disco dati, inserisci una dimensione in GB.
-
Nella sezione Arresto inattivo:
-
Per disattivare l'arresto per inattività, deseleziona Abilita arresto per inattività.
-
Per modificare il periodo di inattività, in Tempo di inattività prima dell'arresto (minuti), modifica il numero con il numero di minuti di inattività che vuoi. Nella console Google Cloud , questa impostazione può essere impostata su qualsiasi valore intero compreso tra 10 e 1440.
-
-
Fai clic su Continua.
-
Nella sezione Ambiente, seleziona un ambiente. Il valore predefinito è Più recente (attualmente Python 3.11).
-
Fai clic su Continua.
-
Nella sezione Networking e sicurezza, nel menu Rete, seleziona una rete. Se non selezioni una rete, viene selezionata la rete predefinita.
-
Nel menu Subnet, seleziona una subnet.
-
Per disattivare l'accesso a internet pubblico, deseleziona Attiva l'accesso a internet pubblico.
-
Per disattivare l'accesso alle credenziali dell'utente finale, deseleziona Attiva le credenziali dell'utente finale.
DISPLAY_NAME
: il nome visualizzato del modello di runtime.PROJECT_ID
: il tuo ID progetto.REGION
: la regione in cui vuoi il modello di runtime.-
MACHINE_TYPE
: il tipo di macchina da utilizzare per il runtime. ACCELERATOR_TYPE
: il tipo di acceleratore hardware da utilizzare per il runtime.ACCELERATOR_COUNT
: il numero di acceleratori da utilizzare per il runtime.REGION
: la regione in cui vuoi il modello di runtime.PROJECT_ID
: il tuo ID progetto.DISPLAY_NAME
: il nome visualizzato del modello di runtime.-
MACHINE_TYPE
: il tipo di macchina da utilizzare per il runtime. ACCELERATOR_TYPE
: il tipo di acceleratore hardware da utilizzare per il runtime.ACCELERATOR_COUNT
: il numero di acceleratori da utilizzare per il runtime.- Accesso al modello di runtime.
- Le autorizzazioni necessarie per creare runtime.
-
Nella console Google Cloud , vai alla pagina Modelli di runtime di Colab Enterprise.
-
Nel menu Regione, seleziona la regione che contiene il modello di runtime.
-
Seleziona il modello di runtime che vuoi eliminare.
-
Fai clic su
Elimina -
Fai clic su Conferma.
- Scopri di più su runtime e modelli di runtime.
- Scopri come creare un runtime in base a un modello di runtime.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare un modello di runtime in Colab Enterprise, chiedi all'amministratore di concederti il ruolo IAM Amministratore Colab Enterprise (roles/aiplatform.colabEnterpriseAdmin
) nel progetto.
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Crea il modello di runtime
Per creare un modello di runtime, puoi utilizzare la console Google Cloud , Google Cloud CLI, l'API REST o Terraform.
Console
Per creare un modello di runtime:
Informazioni di base del runtime
Configura elaborazione
Ambiente
Networking e sicurezza
Completa la creazione del modello di runtime
Fai clic su Crea per completare la creazione del modello di runtime.
Il modello di runtime viene visualizzato nell'elenco della scheda Modelli di runtime.
gcloud
Prima di utilizzare i dati dei comandi riportati di seguito, apporta le seguenti sostituzioni:
Esegui questo comando:
Linux, macOS o Cloud Shell
gcloud colab runtime-templates create --display-name="DISPLAY_NAME" \ --project=PROJECT_ID \ --region=REGION \ --machine-type=MACHINE_TYPE \ --accelerator-type=ACCELERATOR_TYPE \ --accelerator-count=ACCELERATOR_COUNT
Windows (PowerShell)
gcloud colab runtime-templates create --display-name="DISPLAY_NAME" ` --project=PROJECT_ID ` --region=REGION ` --machine-type=MACHINE_TYPE ` --accelerator-type=ACCELERATOR_TYPE ` --accelerator-count=ACCELERATOR_COUNT
Windows (cmd.exe)
gcloud colab runtime-templates create --display-name="DISPLAY_NAME" ^ --project=PROJECT_ID ^ --region=REGION ^ --machine-type=MACHINE_TYPE ^ --accelerator-type=ACCELERATOR_TYPE ^ --accelerator-count=ACCELERATOR_COUNT
Per ulteriori informazioni sul comando per creare un modello di runtime dalla riga di comando, consulta la documentazione di gcloud CLI.
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
Metodo HTTP e URL:
POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates
Corpo JSON della richiesta:
{ "displayName": "DISPLAY_NAME", "machineSpec": { { "machineType": MACHINE_TYPE "acceleratorType": ACCELERATOR_TYPE, "acceleratorCount": ACCELERATOR_COUNT, } }, }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
quindi esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates" | Select-Object -Expand Content
Per saperne di più, consulta la documentazione dell'API REST di notebookRuntimeTemplates.create
.
Terraform
Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base. Per saperne di più, consulta la documentazione di riferimento del fornitore Terraform.
L'esempio seguente utilizza la risorsa Terraform
google_colab_runtime_template
per creare un modello di runtime Colab Enterprise.
Concessione dell'accesso al modello di runtime
Dopo aver creato un modello di runtime, devi concedere l'accesso a un principal per poterlo utilizzare. Un principal può creare un runtime da un modello di runtime solo se dispone di quanto segue:
Vedi Gestire l'accesso a un modello di runtime.
Eliminare un modello di runtime
Per eliminare un modello di runtime:
Risoluzione dei problemi
Questa sezione mostra come risolvere i problemi relativi alla creazione di modelli di runtime in Colab Enterprise.
Impossibile selezionare un numero sufficiente di GPU
Quando crei un modello di runtime, non puoi selezionare il numero di GPU che vuoi. Il problema potrebbe essere dovuto a una quota insufficiente.
Colab Enterprise utilizza la quota di Compute Engine per le GPU. Per saperne di più, consulta la panoramica di quote e limiti di Compute Engine.
Per risolvere il problema, richiedi una modifica della quota.