Questo documento spiega come creare ed eseguire un job Batch che utilizza uno o più volumi di archiviazione esterni. Le opzioni di archiviazione esterna includono disco permanente nuovi o esistenti, nuovi SSD locali, bucket Cloud Storage esistenti e un file system di rete (NFS) esistente, ad esempio una condivisione file Filestore.
Indipendentemente dal fatto che tu aggiunga volumi di archiviazione esterni, ogni VM Compute Engine per un job ha un disco di avvio, che fornisce spazio di archiviazione per l'immagine e le istruzioni del sistema operativo (OS) del job. Per informazioni sulla configurazione del disco di avvio per un job, consulta la panoramica dell'ambiente del sistema operativo VM.
Prima di iniziare
- Se non hai mai utilizzato Batch, consulta la sezione Guida introduttiva a Batch e attiva Batch completando i prerequisiti per progetti e utenti.
-
Per ottenere le autorizzazioni necessarie per creare un job, chiedi all'amministratore di concederti i seguenti ruoli IAM:
-
Batch Job Editor (
roles/batch.jobsEditor
) sul progetto -
Utente service account (
roles/iam.serviceAccountUser
) sul service account del job, che per impostazione predefinita è il service account Compute Engine predefinito -
Crea un job che utilizza un bucket Cloud Storage:
Visualizzatore oggetti Storage (
roles/storage.objectViewer
) sul bucket
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
-
Batch Job Editor (
Crea un job che utilizza volumi di archiviazione
Facoltativamente, un job può utilizzare uno o più volumi di spazio di archiviazione esterno di ciascuno dei seguenti tipi. Per saperne di più su tutti i tipi di volumi di archiviazione e sulle differenze e restrizioni per ciascuno, consulta la documentazione sulle opzioni di archiviazione delle VM Compute Engine.
- Persistent Disk: archiviazione a blocchi permanente a livello di zona o di regione
- SSD locale: archiviazione a blocchi transitoria ad alte prestazioni
- Bucket Cloud Storage: archiviazione di oggetti a costi contenuti
- Network File System (NFS): sistema di file distribuito che segue il protocollo Network File System, ad esempio una condivisione file Filestore, che è un NFS ad alte prestazioni ospitato su Google Cloud
Puoi consentire a un job di utilizzare ogni volume di archiviazione includendolo
nella definizione del job e specificando il
percorso di montaggio (mountPath
)
nei runnable. Per scoprire come creare un job che utilizza volumi di archiviazione, consulta
una o più delle seguenti sezioni:
- Utilizzare un disco permanente
- Utilizzare un SSD locale
- Utilizzare un bucket Cloud Storage
- Utilizzare un file system di rete
Utilizza un disco permanente
Un job che utilizza dischi permanenti presenta le seguenti limitazioni:
Tutti i dischi permanenti: esamina le limitazioni per tutti i dischi permanenti.
Dischi permanenti nuovi e esistenti: ogni disco permanente in un job può essere nuovo (definito e creato con il job) o esistente (già creato nel progetto e specificato nel job). Per utilizzare un disco permanente, deve essere formattato e montato sulle VM del job, che devono trovarsi nella stessa posizione del disco permanente. Batch monta tutti i dischi permanenti inclusi in un job e formatta tutti i nuovi dischi permanenti, ma devi formattare e smontare tutti i dischi permanenti esistenti che vuoi che un job utilizzi.
Le opzioni di località, le opzioni di formato e le opzioni di montaggio supportate variano tra i dischi permanenti nuovi ed esistenti, come descritto nella tabella seguente:
Nuovi dischi permanenti Dischi permanenti esistenti Opzioni formato Il disco permanente viene formattato automaticamente con un
ext4
file system.Devi formattare il disco permanente per utilizzare un file system
ext4
prima di utilizzarlo per un job.Opzioni di montaggio Sono supportate tutte le opzioni.
Sono supportate tutte le opzioni tranne la scrittura. Ciò è dovuto alle limitazioni della modalità multi-writer.
Prima di utilizzarlo per un job, devi scollegare il disco permanente da tutte le VM a cui è collegato.
Opzioni per località Puoi creare solo dischi permanenti a livello di zona.
Puoi selezionare qualsiasi posizione per il tuo lavoro. I dischi permanenti vengono creati nella zona in cui viene eseguito il progetto.
Puoi selezionare dischi permanenti a livello di zona e di regione.
Devi impostare la località del job (o, se specificato, solo le località consentite del job) su solo le località che contengono tutti i dischi permanenti del job. Ad esempio, per un disco permanente a livello di zona, la località del job deve essere la zona del disco; per un disco permanente a livello di regione, la località del job deve essere la regione del disco o, se vengono specificate le zone, una o entrambe le zone specifiche in cui si trova il disco permanente a livello di regione.Modelli di istanza: se vuoi utilizzare un modello di istanza VM durante la creazione di questo job, devi collegare tutti i disco permanente per questo job nel modello di istanza. In caso contrario, se non vuoi utilizzare un modello di istanza, devi collegare i disco permanente direttamente nella definizione del job.
Puoi creare un job che utilizza un disco permanente utilizzando la consoleGoogle Cloud , gcloud CLI, l'API Batch, C++, Go, Java, Node.js o Python.
Console
Utilizzando la console Google Cloud , il seguente esempio crea un job che esegue uno script per leggere un file da un disco permanente a livello di zona esistente che si trova nella zona us-central1-a
. Lo script di esempio presuppone che il job
disponga di un disco permanente zonale esistente che contiene un file di testo denominato
example.txt
nella directory principale.
(Facoltativo) Crea un disco permanente di zona di esempio
Se vuoi creare un disco permanente a livello di zona che puoi utilizzare per eseguire lo script di esempio, esegui le seguenti operazioni prima di creare il job:
Collega un nuovo disco permanente vuoto denominato
example-disk
a una VM Linux nella zonaus-central1-a
, quindi esegui i comandi sulla VM per formattare e montare il disco. Per istruzioni, vedi Aggiungi un disco permanente alla tua VM.Non disconnetterti ancora dalla VM.
Per creare
example.txt
sul disco permanente, esegui i seguenti comandi sulla VM:Per modificare la directory di lavoro corrente nella directory principale del disco permanente, digita il seguente comando:
cd VM_MOUNT_PATH
Sostituisci VM_MOUNT_PATH con il percorso della directory in cui è stato montato il disco permanente su questa VM nel passaggio precedente, ad esempio
/mnt/disks/example-disk
.Premi
Enter
.Per creare e definire un file denominato
example.txt
, digita questo comando:cat > example.txt
Premi
Enter
.Digita i contenuti del file. Ad esempio, digita
Hello world!
.Per salvare il file, premi
Ctrl+D
(oCommand+D
su macOS).
Al termine dell'operazione, puoi disconnetterti dalla VM.
Scollega il disco permanente dalla VM.
Se non hai più bisogno della VM, puoi eliminarla, il che scollega automaticamente il disco permanente.
In caso contrario, scollega il disco permanente. Per istruzioni, vedi Scollegamento e ricollegamento di dischi di avvio e scollega il disco permanente
example-disk
anziché il disco di avvio della VM.
Crea un job che utilizzi il disco permanente a livello di zona esistente
Per creare un job che utilizza dischi permanenti di zona esistenti utilizzando la consoleGoogle Cloud :
Nella console Google Cloud , vai alla pagina Elenco dei job.
Fai clic su
Crea. Si apre la pagina Crea job batch. Nel riquadro a sinistra è selezionata la pagina Dettagli job.Configura la pagina Dettagli job:
(Facoltativo) Nel campo Nome job, personalizza il nome del job.
Ad esempio, inserisci
example-disk-job
.Configura la sezione Dettagli attività:
Nella finestra Nuovo eseguibile, aggiungi almeno uno script o un container da eseguire per questo job.
Ad esempio, per eseguire uno script che stampa i contenuti di un file denominato
example.txt
e che si trova nella directory principale del disco permanente utilizzato da questo job, procedi nel seguente modo:Seleziona la casella di controllo Script. Viene visualizzata una casella di testo.
Nella casella di testo, inserisci il seguente script:
echo "Here is the content of the example.txt file in the persistent disk." cat MOUNT_PATH/example.txt
Sostituisci MOUNT_PATH con il percorso in cui prevedi di montare il disco permanente sulle VM per questo job, ad esempio
/mnt/disks/example-disk
.Fai clic su Fine.
Nel campo Conteggio attività, inserisci il numero di attività per questo job.
Ad esempio, inserisci
1
(valore predefinito).Nel campo Parallelismo, inserisci il numero di attività da eseguire contemporaneamente.
Ad esempio, inserisci
1
(valore predefinito).
Configura la pagina Specifiche delle risorse:
Nel riquadro a sinistra, fai clic su Specifiche delle risorse. Viene visualizzata la pagina Specifiche delle risorse.
Seleziona la sede per questo lavoro. Per utilizzare un disco permanente a livello di zona esistente, le VM di un job devono trovarsi nella stessa zona.
Nel campo Regione, seleziona una regione.
Ad esempio, per utilizzare il disco permanente a livello di zona di esempio, seleziona
us-central1 (Iowa)
(impostazione predefinita).Nel campo Zona, seleziona una zona.
Ad esempio, seleziona
us-central1-a (Iowa)
.
Configura la pagina Configurazioni aggiuntive:
Nel riquadro a sinistra, fai clic su Configurazioni aggiuntive. Si apre la pagina Configurazioni aggiuntive.
Per ogni disco permanente zonale esistente che vuoi montare in questo job:
Nella sezione Volume di archiviazione, fai clic su Aggiungi nuovo volume. Viene visualizzata la finestra Nuovo volume.
Nella finestra Nuovo volume:
Nella sezione Tipo di volume, seleziona Disco permanente (valore predefinito).
Nell'elenco Disco, seleziona un disco permanente zonale esistente che vuoi montare su questo job. Il disco deve trovarsi nella stessa zona di questo job.
Ad esempio, seleziona il disco permanente di zona esistente che hai preparato, che si trova nella zona
us-central1-a
e contiene il fileexample.txt
.(Facoltativo) Se vuoi rinominare questo disco permanente zonale, svolgi i seguenti passaggi:
Seleziona Personalizza il nome del dispositivo.
Nel campo Nome dispositivo, inserisci il nuovo nome per il disco.
Nel campo Percorso di montaggio, inserisci il percorso di montaggio (MOUNT_PATH) per questo disco permanente:
Ad esempio, inserisci quanto segue:
/mnt/disks/EXISTING_PERSISTENT_DISK_NAME
Sostituisci EXISTING_PERSISTENT_DISK_NAME con il nome del disco. Se hai rinominato il disco permanente zonale, utilizza il nuovo nome.
Ad esempio, sostituisci EXISTING_PERSISTENT_DISK_NAME con
example-disk
.Fai clic su Fine.
(Facoltativo) Configura gli altri campi per questo job.
(Facoltativo) Per esaminare la configurazione del job, nel riquadro a sinistra, fai clic su Anteprima.
Fai clic su Crea.
Nella pagina Dettagli job viene visualizzato il job che hai creato.
gcloud
Utilizzando gcloud CLI, il seguente esempio crea un job che
collega e monta un disco permanente esistente e un nuovo disco permanente.
Il job ha tre attività, ognuna delle quali esegue uno script per creare un file nel nuovo disco permanente denominato output_task_TASK_INDEX.txt
, dove TASK_INDEX è l'indice di ogni attività: 0, 1 e 2.
Per creare un job che utilizza dischi permanenti utilizzando gcloud CLI, utilizza il
comando gcloud batch jobs submit
.
Nel file di configurazione JSON del job, specifica i dischi permanenti nel campo
instances
e monta il disco permanente nel campo volumes
.
Crea un file JSON.
Se non utilizzi un modello di istanza per questo job, crea un file JSON con i seguenti contenuti:
{ "allocationPolicy": { "instances": [ { "policy": { "disks": [ { "deviceName": "EXISTING_PERSISTENT_DISK_NAME", "existingDisk": "projects/PROJECT_ID/EXISTING_PERSISTENT_DISK_LOCATION/disks/EXISTING_PERSISTENT_DISK_NAME" }, { "newDisk": { "sizeGb": NEW_PERSISTENT_DISK_SIZE, "type": "NEW_PERSISTENT_DISK_TYPE" }, "deviceName": "NEW_PERSISTENT_DISK_NAME" } ] } } ], "location": { "allowedLocations": [ "EXISTING_PERSISTENT_DISK_LOCATION" ] } }, "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/disks/NEW_PERSISTENT_DISK_NAME/output_task_${BATCH_TASK_INDEX}.txt" } } ], "volumes": [ { "deviceName": "NEW_PERSISTENT_DISK_NAME", "mountPath": "/mnt/disks/NEW_PERSISTENT_DISK_NAME", "mountOptions": "rw,async" }, { "deviceName": "EXISTING_PERSISTENT_DISK_NAME", "mountPath": "/mnt/disks/EXISTING_PERSISTENT_DISK_NAME" } ] }, "taskCount":3 } ], "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Sostituisci quanto segue:
PROJECT_ID
: l'ID progetto del tuo progetto.EXISTING_PERSISTENT_DISK_NAME
: il nome di un disco permanente esistente.EXISTING_PERSISTENT_DISK_LOCATION
: la posizione di un disco permanente esistente. Per ogni disco permanente zonale esistente, la località del job deve essere la zona del disco; per ogni disco permanente regionale esistente, la località del job deve essere la regione del disco o, se vengono specificate zone, una o entrambe le zone specifiche in cui si trova il disco permanente regionale. Se non specifichi dischi permanenti esistenti, puoi selezionare qualsiasi località. Scopri di più sul campoallowedLocations
.NEW_PERSISTENT_DISK_SIZE
: le dimensioni del nuovo disco permanente in GB. Le dimensioni consentite dipendono dal tipo di disco permanente, ma il minimo è spesso 10 GB (10
) e il massimo è spesso 64 TB (64000
).NEW_PERSISTENT_DISK_TYPE
: il tipo di disco del nuovo disco permanente,pd-standard
,pd-balanced
,pd-ssd
opd-extreme
. Il tipo di disco predefinito per i dischi permanenti non di avvio èpd-standard
.NEW_PERSISTENT_DISK_NAME
: il nome del nuovo disco permanente.
Se utilizzi un modello di istanza VM per questo job, crea un file JSON come mostrato in precedenza, ma sostituisci il campo
instances
con quanto segue:"instances": [ { "instanceTemplate": "INSTANCE_TEMPLATE_NAME" } ],
dove
INSTANCE_TEMPLATE_NAME
è il nome del modello di istanza per questo job. Per un job che utilizza dischi permanenti, questo modello di istanza deve definire e collegare i dischi permanenti che vuoi che il job utilizzi. Per questo esempio, il modello deve definire e collegare un nuovo disco permanente denominatoNEW_PERSISTENT_DISK_NAME
e collegare un disco permanente esistente denominatoEXISTING_PERSISTENT_DISK_NAME
.
Esegui questo comando:
gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILE
Sostituisci quanto segue:
JOB_NAME
: il nome del job.LOCATION
: la sede del lavoro.JSON_CONFIGURATION_FILE
: il percorso di un file JSON con i dettagli di configurazione del job.
API
Utilizzando l'API Batch, il seguente esempio crea un job
che collega e monta un disco permanente esistente e un nuovo disco permanente. Il job ha tre attività, ognuna delle quali esegue uno script per creare un file nel nuovo disco permanente denominato output_task_TASK_INDEX.txt
, dove TASK_INDEX è l'indice di ogni attività: 0, 1 e 2.
Per creare un job che utilizza dischi permanenti utilizzando l'API Batch, utilizza il
metodo jobs.create
.
Nella richiesta, specifica i dischi permanenti nel campo
instances
e monta il disco permanente nel campo volumes
.
Se non utilizzi un modello di istanza per questo job, invia la seguente richiesta:
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME { "allocationPolicy": { "instances": [ { "policy": { "disks": [ { "deviceName": "EXISTING_PERSISTENT_DISK_NAME", "existingDisk": "projects/PROJECT_ID/EXISTING_PERSISTENT_DISK_LOCATION/disks/EXISTING_PERSISTENT_DISK_NAME" }, { "newDisk": { "sizeGb": NEW_PERSISTENT_DISK_SIZE, "type": "NEW_PERSISTENT_DISK_TYPE" }, "deviceName": "NEW_PERSISTENT_DISK_NAME" } ] } } ], "location": { "allowedLocations": [ "EXISTING_PERSISTENT_DISK_LOCATION" ] } }, "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/disks/NEW_PERSISTENT_DISK_NAME/output_task_${BATCH_TASK_INDEX}.txt" } } ], "volumes": [ { "deviceName": "NEW_PERSISTENT_DISK_NAME", "mountPath": "/mnt/disks/NEW_PERSISTENT_DISK_NAME", "mountOptions": "rw,async" }, { "deviceName": "EXISTING_PERSISTENT_DISK_NAME", "mountPath": "/mnt/disks/EXISTING_PERSISTENT_DISK_NAME" } ] }, "taskCount":3 } ], "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Sostituisci quanto segue:
PROJECT_ID
: l'ID progetto del tuo progetto.LOCATION
: la sede del lavoro.JOB_NAME
: il nome del job.EXISTING_PERSISTENT_DISK_NAME
: il nome di un disco permanente esistente.EXISTING_PERSISTENT_DISK_LOCATION
: la posizione di un disco permanente esistente. Per ogni disco permanente zonale esistente, la località del job deve essere la zona del disco; per ogni disco permanente regionale esistente, la località del job deve essere la regione del disco o, se vengono specificate zone, una o entrambe le zone specifiche in cui si trova il disco permanente regionale. Se non specifichi dischi permanenti esistenti, puoi selezionare qualsiasi posizione. Scopri di più sul campoallowedLocations
.NEW_PERSISTENT_DISK_SIZE
: le dimensioni del nuovo disco permanente in GB. Le dimensioni consentite dipendono dal tipo di disco permanente, ma il minimo è spesso 10 GB (10
) e il massimo è spesso 64 TB (64000
).NEW_PERSISTENT_DISK_TYPE
: il tipo di disco del nuovo disco permanente,pd-standard
,pd-balanced
,pd-ssd
opd-extreme
. Il tipo di disco predefinito per i dischi permanenti non di avvio èpd-standard
.NEW_PERSISTENT_DISK_NAME
: il nome del nuovo disco permanente.
Se utilizzi un modello di istanza VM per questo job, crea un file JSON come mostrato in precedenza, ma sostituisci il campo
instances
con quanto segue:"instances": [ { "instanceTemplate": "INSTANCE_TEMPLATE_NAME" } ], ...
dove
INSTANCE_TEMPLATE_NAME
è il nome del modello di istanza per questo job. Per un job che utilizza dischi permanenti, questo modello di istanza deve definire e collegare i dischi permanenti che vuoi che il job utilizzi. Per questo esempio, il modello deve definire e collegare un nuovo disco permanente denominatoNEW_PERSISTENT_DISK_NAME
e collegare un disco permanente esistente denominatoEXISTING_PERSISTENT_DISK_NAME
.
C++
Per creare un job Batch che utilizzi dischi permanenti nuovi o esistenti utilizzando le librerie client di Cloud per C++, utilizza la funzione CreateJob
e includi quanto segue:
- Per collegare dischi permanenti alle VM per un job,
includi uno dei seguenti elementi:
- Se non utilizzi un modello di istanza VM per questo job,
utilizza il metodo
set_remote_path
. - Se utilizzi un modello di istanza VM per questo job, utilizza il
metodo
set_instance_template
.
- Se non utilizzi un modello di istanza VM per questo job,
utilizza il metodo
- Per montare i dischi permanenti sul job, utilizza il campo
volumes
con i campideviceName
emountPath
. Per i nuovi dischi permanenti, utilizza anche il campomountOptions
per abilitare la scrittura.
Per un esempio di codice di un caso d'uso simile, consulta Utilizzare un bucket Cloud Storage.
Vai
Per creare un job Batch che utilizzi dischi permanenti nuovi o esistenti utilizzando le librerie client Cloud per Go, utilizza la funzione CreateJob
e includi quanto segue:
- Per collegare dischi permanenti alle VM per un job,
includi uno dei seguenti elementi:
- Se non utilizzi un modello di istanza VM per questo job,
includi il tipo
AllocationPolicy_AttachedDisk
. - Se utilizzi un modello di istanza VM per questo job,
includi il tipo
AllocationPolicy_InstancePolicyOrTemplate_InstanceTemplate
.
- Se non utilizzi un modello di istanza VM per questo job,
includi il tipo
- Per montare i dischi permanenti sul job, utilizza il
tipo
Volume
con il tipoVolume_DeviceName
e il campoMountPath
. Per i nuovi dischi permanenti, utilizza anche il campoMountOptions
per abilitare la scrittura.
Java
Per creare un job Batch che utilizzi dischi permanenti nuovi o esistenti utilizzando le librerie client Cloud per Java, utilizza la classe CreateJobRequest
e includi quanto segue:
- Per collegare dischi permanenti alle VM per un job,
includi uno dei seguenti elementi:
- Se non utilizzi un modello di istanza VM per questo job,
includi il metodo
setDisks
. - Se utilizzi un modello di istanza VM per questo job,
includi il metodo
setInstanceTemplate
.
- Se non utilizzi un modello di istanza VM per questo job,
includi il metodo
- Per montare i dischi permanenti sul job, utilizza la
classe
Volume
con il metodosetDeviceName
e il metodosetMountPath
. Per i nuovi dischi permanenti, utilizza anche il metodosetMountOptions
per abilitare la scrittura.
Ad esempio, utilizza il seguente esempio di codice:
Node.js
Per creare un job Batch che utilizzi dischi permanenti nuovi o esistenti utilizzando le librerie client Cloud per Node.js, utilizza il metodo createJob
e includi quanto segue:
- Per collegare dischi permanenti alle VM per un job,
includi uno dei seguenti elementi:
- Se non utilizzi un modello di istanza VM per questo job,
includi la classe
AllocationPolicy.AttachedDisk
. - Se utilizzi un modello di istanza VM per questo job,
includi la proprietà
instanceTemplate
.
- Se non utilizzi un modello di istanza VM per questo job,
includi la classe
- Per montare i dischi permanenti sul job, utilizza la
classe
Volume
con la proprietàdeviceName
e la proprietàmountPath
. Per i nuovi dischi permanenti, utilizza anche la proprietàmountOptions
per abilitare la scrittura.
Python
Per creare un job Batch che utilizzi dischi permanenti nuovi o esistenti utilizzando le librerie client di Cloud per Python, utilizza la funzione CreateJob
e includi quanto segue:
- Per collegare dischi permanenti alle VM per un job,
includi uno dei seguenti elementi:
- Se non utilizzi un modello di istanza VM per questo job,
includi la classe
AttachedDisk
. - Se utilizzi un modello di istanza VM per questo job,
includi l'attributo
instance_template
.
- Se non utilizzi un modello di istanza VM per questo job,
includi la classe
- Per montare i dischi permanenti sul job, utilizza la
classe
Volume
con l'attributodevice_name
e l'attributomount_path
. Per i nuovi dischi permanenti, utilizza anche l'attributomount_options
per abilitare la scrittura.
Ad esempio, utilizza il seguente esempio di codice:
Utilizza un SSD locale
Un job che utilizza SSD locali presenta le seguenti limitazioni:
- Tutte le SSD locali. Rivedi le limitazioni per tutte le SSD locali.
- Modelli di istanza: se vuoi specificare un modello di istanza VM durante la creazione di questo job, devi collegare tutti i disco permanente per questo job nel modello di istanza. In caso contrario, se non vuoi utilizzare un modello di istanza, devi collegare i disco permanente direttamente nella definizione del job.
Puoi creare un job che utilizza un SSD locale utilizzando
gcloud CLI, l'API Batch, Java o Python.
Il seguente esempio descrive come creare un job che crea, collega e
monta un SSD locale. Il job ha anche tre attività
che eseguono ciascuna uno script per creare un file nell'SSD locale denominato
output_task_TASK_INDEX.txt
, dove
TASK_INDEX
è l'indice di ogni attività:
0
, 1
e 2
.
gcloud
Per creare un job che utilizza gli SSD locali utilizzando
gcloud CLI, utilizza il
comando gcloud batch jobs submit
.
Nel file di configurazione JSON del job, crea e collega gli SSD locali nel campo
instances
e monta gli SSD locali nel campo volumes
.
Crea un file JSON.
Se non utilizzi un modello di istanza per questo job, crea un file JSON con i seguenti contenuti:
{ "allocationPolicy": { "instances": [ { "policy": { "machineType": MACHINE_TYPE, "disks": [ { "newDisk": { "sizeGb": LOCAL_SSD_SIZE, "type": "local-ssd" }, "deviceName": "LOCAL_SSD_NAME" } ] } } ] }, "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/disks/LOCAL_SSD_NAME/output_task_${BATCH_TASK_INDEX}.txt" } } ], "volumes": [ { "deviceName": "LOCAL_SSD_NAME", "mountPath": "/mnt/disks/LOCAL_SSD_NAME", "mountOptions": "rw,async" } ] }, "taskCount":3 } ], "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Sostituisci quanto segue:
MACHINE_TYPE
: il tipo di macchina, che può essere predefinito o personalizzato, delle VM del job. Il numero consentito di SSD locali dipende dal tipo di macchina delle VM del job.LOCAL_SSD_NAME
: il nome di un SSD locale creato per questo job.LOCAL_SSD_SIZE
: le dimensioni di tutti gli SSD locali in GB. Ogni SSD locale ha una dimensione di 375 GB, quindi questo valore deve essere un multiplo di375
GB. Ad esempio, per 2 SSD locali, imposta questo valore su750
GB.
Se utilizzi un modello di istanza VM per questo job, crea un file JSON come mostrato in precedenza, ma sostituisci il campo
instances
con quanto segue:"instances": [ { "instanceTemplate": "INSTANCE_TEMPLATE_NAME" } ],
dove
INSTANCE_TEMPLATE_NAME
è il nome del modello di istanza per questo job. Per un job che utilizza SSD locali, questo modello di istanza deve definire e collegare gli SSD locali che vuoi che il job utilizzi. Per questo esempio, il modello deve definire e collegare un SSD locale denominatoLOCAL_SSD_NAME
.
Esegui questo comando:
gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILE
Sostituisci quanto segue:
JOB_NAME
: il nome del job.LOCATION
: la sede del lavoro.JSON_CONFIGURATION_FILE
: il percorso di un file JSON con i dettagli di configurazione del job.
API
Per creare un job che utilizza gli SSD locali utilizzando l'API Batch, utilizza il metodo jobs.create
.
Nella richiesta, crea e collega gli SSD locali nel campo instances
e monta gli SSD locali nel campo volumes
.
Se non utilizzi un modello di istanza per questo job, invia la seguente richiesta:
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME { "allocationPolicy": { "instances": [ { "policy": { "machineType": MACHINE_TYPE, "disks": [ { "newDisk": { "sizeGb": LOCAL_SSD_SIZE, "type": "local-ssd" }, "deviceName": "LOCAL_SSD_NAME" } ] } } ] }, "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> /mnt/disks/LOCAL_SSD_NAME/output_task_${BATCH_TASK_INDEX}.txt" } } ], "volumes": [ { "deviceName": "LOCAL_SSD_NAME", "mountPath": "/mnt/disks/LOCAL_SSD_NAME", "mountOptions": "rw,async" } ] }, "taskCount":3 } ], "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Sostituisci quanto segue:
PROJECT_ID
: l'ID progetto del tuo progetto.LOCATION
: la sede del lavoro.JOB_NAME
: il nome del job.MACHINE_TYPE
: il tipo di macchina, che può essere predefinito o personalizzato, delle VM del job. Il numero consentito di SSD locali dipende dal tipo di macchina delle VM del job.LOCAL_SSD_NAME
: il nome di un SSD locale creato per questo job.LOCAL_SSD_SIZE
: le dimensioni di tutti gli SSD locali in GB. Ogni SSD locale ha una dimensione di 375 GB, quindi questo valore deve essere un multiplo di375
GB. Ad esempio, per 2 SSD locali, imposta questo valore su750
GB.
Se utilizzi un modello di istanza VM per questo job, crea un file JSON come mostrato in precedenza, ma sostituisci il campo
instances
con quanto segue:"instances": [ { "instanceTemplate": "INSTANCE_TEMPLATE_NAME" } ], ...
dove
INSTANCE_TEMPLATE_NAME
è il nome del modello di istanza per questo job. Per un job che utilizza SSD locali, questo modello di istanza deve definire e collegare gli SSD locali che vuoi che il job utilizzi. Per questo esempio, il modello deve definire e collegare un SSD locale denominatoLOCAL_SSD_NAME
.
Vai
Java
Node.js
Python
Utilizzare un bucket Cloud Storage
Per creare un job che utilizza un bucket Cloud Storage esistente, seleziona uno dei seguenti metodi:
- Consigliato: monta un bucket direttamente sulle VM del job specificando il bucket nella definizione del job, come mostrato in questa sezione. Quando il job viene eseguito, il bucket viene montato automaticamente sulle VM per il job utilizzando Cloud Storage FUSE.
- Crea un job con attività che accedono direttamente a un bucket Cloud Storage utilizzando gcloud CLI o le librerie client per l'API Cloud Storage. Per scoprire come accedere a un bucket Cloud Storage direttamente da una VM, consulta la documentazione di Compute Engine per Scrittura e lettura dei dati dai bucket Cloud Storage.
Prima di creare un job che utilizza un bucket, crea un bucket o identificane uno esistente. Per saperne di più, consulta Creare bucket e Elencare bucket.
Puoi creare un job che utilizza un bucket Cloud Storage utilizzando la consoleGoogle Cloud , gcloud CLI, l'API Batch, C++, Go, Java, Node.js o Python.
Il seguente esempio descrive come creare un job che monta un bucket Cloud Storage. Il job ha anche tre attività che eseguono ciascuna uno script per creare un file nel bucket denominato output_task_TASK_INDEX.txt
, dove TASK_INDEX
è l'indice di ogni attività: 0
, 1
e 2
.
Console
Per creare un job che utilizza un bucket Cloud Storage utilizzando la consoleGoogle Cloud , segui questi passaggi:
Nella console Google Cloud , vai alla pagina Elenco dei job.
Fai clic su
Crea. Si apre la pagina Crea job batch. Nel riquadro a sinistra è selezionata la pagina Dettagli job.Configura la pagina Dettagli job:
(Facoltativo) Nel campo Nome job, personalizza il nome del job.
Ad esempio, inserisci
example-bucket-job
.Configura la sezione Dettagli attività:
Nella finestra Nuovo eseguibile, aggiungi almeno uno script o un container da eseguire per questo job.
Ad esempio, esegui le seguenti operazioni:
Seleziona la casella di controllo Script. Viene visualizzata una casella di testo.
Nella casella di testo, inserisci il seguente script:
echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt
Sostituisci MOUNT_PATH con il percorso di montaggio che i runnable di questo job utilizzano per accedere a un bucket Cloud Storage esistente. Il percorso deve iniziare con
/mnt/disks/
seguito da una directory o un percorso a tua scelta. Ad esempio, se vuoi rappresentare questo bucket con una directory denominatamy-bucket
, imposta il percorso di montaggio su/mnt/disks/my-bucket
.Fai clic su Fine.
Nel campo Conteggio attività, inserisci il numero di attività per questo job.
Ad esempio, inserisci
3
.Nel campo Parallelismo, inserisci il numero di attività da eseguire contemporaneamente.
Ad esempio, inserisci
1
(valore predefinito).
Configura la pagina Configurazioni aggiuntive:
Nel riquadro a sinistra, fai clic su Configurazioni aggiuntive. Si apre la pagina Configurazioni aggiuntive.
Per ogni bucket Cloud Storage che vuoi montare in questo job, procedi nel seguente modo:
Nella sezione Volume di archiviazione, fai clic su Aggiungi nuovo volume. Viene visualizzata la finestra Nuovo volume.
Nella finestra Nuovo volume:
Nella sezione Tipo di volume, seleziona Bucket Cloud Storage.
Nel campo Nome bucket di archiviazione, inserisci il nome di un bucket esistente.
Ad esempio, inserisci il bucket specificato nel runnable di questo job.
Nel campo Percorso di montaggio, inserisci il percorso di montaggio del bucket (MOUNT_PATH) che hai specificato nell'eseguibile.
Fai clic su Fine.
(Facoltativo) Configura gli altri campi per questo job.
(Facoltativo) Per esaminare la configurazione del job, nel riquadro a sinistra, fai clic su Anteprima.
Fai clic su Crea.
Nella pagina Dettagli job viene visualizzato il job che hai creato.
gcloud
Per creare un job che utilizza un bucket Cloud Storage utilizzando gcloud CLI, utilizza il comando gcloud batch jobs submit
.
Nel file di configurazione JSON del job, monta il bucket nel campo
volumes
.
Ad esempio, per creare un job che restituisce file a Cloud Storage:
Crea un file JSON con i seguenti contenuti:
{ "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt" } } ], "volumes": [ { "gcs": { "remotePath": "BUCKET_PATH" }, "mountPath": "MOUNT_PATH" } ] }, "taskCount": 3 } ], "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Sostituisci quanto segue:
BUCKET_PATH
: il percorso della directory del bucket a cui vuoi che questo job acceda, che deve iniziare con il nome del bucket. Ad esempio, per un bucket denominatoBUCKET_NAME
, il percorsoBUCKET_NAME
rappresenta la directory principale del bucket e il percorsoBUCKET_NAME/subdirectory
rappresenta la sottodirectorysubdirectory
.MOUNT_PATH
: il percorso di montaggio utilizzato dai componenti eseguibili del job per accedere a questo bucket. Il percorso deve iniziare con/mnt/disks/
seguito da una directory o un percorso a tua scelta. Ad esempio, se vuoi rappresentare questo bucket con una directory denominatamy-bucket
, imposta il percorso di montaggio su/mnt/disks/my-bucket
.
Esegui questo comando:
gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILE
Sostituisci quanto segue:
JOB_NAME
: il nome del job.LOCATION
: la sede del lavoro.JSON_CONFIGURATION_FILE
: il percorso di un file JSON con i dettagli di configurazione del job.
API
Per creare un job che utilizza un bucket Cloud Storage utilizzando l'API Batch, utilizza il metodo jobs.create
e monta il bucket nel campo volumes
.
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt"
}
}
],
"volumes": [
{
"gcs": {
"remotePath": "BUCKET_PATH"
},
"mountPath": "MOUNT_PATH"
}
]
},
"taskCount": 3
}
],
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
Sostituisci quanto segue:
PROJECT_ID
: l'ID progetto del tuo progetto.LOCATION
: la sede del lavoro.JOB_NAME
: il nome del job.BUCKET_PATH
: il percorso della directory del bucket a cui vuoi che questo job acceda, che deve iniziare con il nome del bucket. Ad esempio, per un bucket denominatoBUCKET_NAME
, il percorsoBUCKET_NAME
rappresenta la directory principale del bucket e il percorsoBUCKET_NAME/subdirectory
rappresenta la sottodirectorysubdirectory
.MOUNT_PATH
: il percorso di montaggio utilizzato dai componenti eseguibili del job per accedere a questo bucket. Il percorso deve iniziare con/mnt/disks/
seguito da una directory o un percorso a tua scelta. Ad esempio, se vuoi rappresentare questo bucket con una directory denominatamy-bucket
, imposta il percorso di montaggio su/mnt/disks/my-bucket
.
C++
C++
Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Batch per C++.
Per eseguire l'autenticazione in Batch, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Vai
Go
Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Batch per Go.
Per eseguire l'autenticazione in Batch, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Java
Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Batch per Java.
Per eseguire l'autenticazione in Batch, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Node.js
Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Batch per Node.js.
Per eseguire l'autenticazione in Batch, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Python
Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Batch per Python.
Per eseguire l'autenticazione in Batch, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Utilizzare un file system di rete
Puoi creare un job che utilizza un file system di rete (NFS) esistente, ad esempio una condivisione file Filestore, utilizzando la console Google Cloud , gcloud CLI o l'API Batch.
Prima di creare un job che utilizza un NFS, assicurati che il firewall della tua rete sia configurato correttamente per consentire il traffico tra le VM del job e l'NFS. Per ulteriori informazioni, vedi Configurazione delle regole firewall per Filestore.
L'esempio seguente descrive come creare un job che specifica e
monta un NFS. Il job ha anche tre attività che eseguono ciascuna uno script per creare un file nel file system NFS denominato output_task_TASK_INDEX.txt
, dove TASK_INDEX
è l'indice di ogni attività: 0
, 1
e 2
.
Console
Per creare un job che utilizza un NFS utilizzando la console Google Cloud :
Nella console Google Cloud , vai alla pagina Elenco dei job.
Fai clic su
Crea. Si apre la pagina Crea job batch. Nel riquadro a sinistra è selezionata la pagina Dettagli job.Configura la pagina Dettagli job:
(Facoltativo) Nel campo Nome job, personalizza il nome del job.
Ad esempio, inserisci
example-nfs-job
.Configura la sezione Dettagli attività:
Nella finestra Nuovo eseguibile, aggiungi almeno uno script o un container da eseguire per questo job.
Ad esempio, esegui le seguenti operazioni:
Seleziona la casella di controllo Script. Viene visualizzata una casella di testo.
Nella casella di testo, inserisci il seguente script:
echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt
Sostituisci MOUNT_PATH con il percorso di montaggio utilizzato dall'eseguibile del job per accedere a questo NFS. Il percorso deve iniziare con
/mnt/disks/
seguito da una directory o un percorso a tua scelta. Ad esempio, se vuoi rappresentare questo NFS con una directory denominatamy-nfs
, imposta il percorso di montaggio su/mnt/disks/my-nfs
.Fai clic su Fine.
Nel campo Conteggio attività, inserisci il numero di attività per questo job.
Ad esempio, inserisci
3
.Nel campo Parallelismo, inserisci il numero di attività da eseguire contemporaneamente.
Ad esempio, inserisci
1
(valore predefinito).
Configura la pagina Configurazioni aggiuntive:
Nel riquadro a sinistra, fai clic su Configurazioni aggiuntive. Si apre la pagina Configurazioni aggiuntive.
Per ogni bucket Cloud Storage che vuoi montare in questo job, procedi nel seguente modo:
Nella sezione Volume di archiviazione, fai clic su Aggiungi nuovo volume. Viene visualizzata la finestra Nuovo volume.
Nella finestra Nuovo volume:
Nella sezione Tipo di volume, seleziona Network File System.
Nel campo File server, inserisci l'indirizzo IP del server in cui si trova l'NFS specificato nell'eseguibile di questo job.
Ad esempio, se NFS è una condivisione file Filestore, specifica l'indirizzo IP dell'istanza Filestore, che puoi ottenere descrivendo l'istanza Filestore.
Nel campo Percorso remoto, inserisci un percorso che possa accedere all'NFS specificato nel passaggio precedente.
Il percorso della directory NFS deve iniziare con un
/
seguito dalla directory principale di NFS.Nel campo Percorso di montaggio, inserisci il percorso di montaggio di NFS (MOUNT_PATH) che hai specificato nel passaggio precedente.
Fai clic su Fine.
(Facoltativo) Configura gli altri campi per questo job.
(Facoltativo) Per esaminare la configurazione del job, nel riquadro a sinistra, fai clic su Anteprima.
Fai clic su Crea.
Nella pagina Dettagli job viene visualizzato il job che hai creato.
gcloud
Per creare un job che utilizza un NFS utilizzando
gcloud CLI, utilizza il
comando gcloud batch jobs submit
.
Nel file di configurazione JSON del job, monta NFS nel campo
volumes
.
Crea un file JSON con i seguenti contenuti:
{ "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt" } } ], "volumes": [ { "nfs": { "server": "NFS_IP_ADDRESS", "remotePath": "NFS_PATH" }, "mountPath": "MOUNT_PATH" } ] }, "taskCount": 3 } ], "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Sostituisci quanto segue:
NFS_IP_ADDRESS
: l'indirizzo IP di NFS. Ad esempio, se il tuo NFS è una condivisione file di Filestore, specifica l'indirizzo IP dell'istanza Filestore, che puoi ottenere descrivendo l'istanza Filestore.NFS_PATH
: il percorso della directory NFS a cui vuoi che questo job acceda, che deve iniziare con/
seguito dalla directory principale di NFS. Ad esempio, per una condivisione file Filestore denominataFILE_SHARE_NAME
, il percorso/FILE_SHARE_NAME
rappresenta la directory radice della condivisione file e il percorso/FILE_SHARE_NAME/subdirectory
rappresenta la sottodirectorysubdirectory
.MOUNT_PATH
: il percorso di montaggio utilizzato dai runnable del job per accedere a questo NFS. Il percorso deve iniziare con/mnt/disks/
seguito da una directory o un percorso a tua scelta. Ad esempio, se vuoi rappresentare questo NFS con una directory denominatamy-nfs
, imposta il percorso di montaggio su/mnt/disks/my-nfs
.
Esegui questo comando:
gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILE
Sostituisci quanto segue:
JOB_NAME
: il nome del job.LOCATION
: la sede del lavoro.JSON_CONFIGURATION_FILE
: il percorso di un file JSON con i dettagli di configurazione del job.
API
Per creare un job che utilizza un NFS utilizzando l'API Batch, utilizza il
metodo jobs.create
e monta l'NFS nel campo volumes
.
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello world from task ${BATCH_TASK_INDEX}. >> MOUNT_PATH/output_task_${BATCH_TASK_INDEX}.txt"
}
}
],
"volumes": [
{
"nfs": {
"server": "NFS_IP_ADDRESS",
"remotePath": "NFS_PATH"
},
"mountPath": "MOUNT_PATH"
}
]
},
"taskCount": 3
}
],
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
Sostituisci quanto segue:
PROJECT_ID
: l'ID progetto del tuo progetto.LOCATION
: la sede del lavoro.JOB_NAME
: il nome del job.NFS_IP_ADDRESS
: l'indirizzo IP del Network File System. Ad esempio, se il tuo NFS è una condivisione file di Filestore, specifica l'indirizzo IP dell'istanza Filestore, che puoi ottenere descrivendo l'istanza Filestore.NFS_PATH
: il percorso della directory NFS a cui vuoi che questo job acceda, che deve iniziare con/
seguito dalla directory principale di NFS. Ad esempio, per una condivisione file Filestore denominataFILE_SHARE_NAME
, il percorso/FILE_SHARE_NAME
rappresenta la directory principale della condivisione file e il percorso/FILE_SHARE_NAME/subdirectory
rappresenta una sottodirectory.MOUNT_PATH
: il percorso di montaggio utilizzato dai runnable del job per accedere a questo NFS. Il percorso deve iniziare con/mnt/disks/
seguito da una directory o un percorso a tua scelta. Ad esempio, se vuoi rappresentare questo NFS con una directory denominatamy-nfs
, imposta il percorso di montaggio su/mnt/disks/my-nfs
.
Java
Node.js
Python
Passaggi successivi
- Se hai problemi a creare o eseguire un job, consulta la sezione Risoluzione dei problemi.
- Visualizzare lavori e attività.
- Scopri di più sulle opzioni di creazione dei job.