Esta página foi traduzida pela API Cloud Translation.

Modelos de provisionamento de instâncias do Compute Engine

Linux Windows

Neste documento, descrevemos os modelos de provisionamento para instâncias do Compute Engine. Para saber mais sobre as opções de implantação, consulte Escolher uma estratégia de implantação do Compute Engine para sua carga de trabalho.

Os modelos de provisionamento determinam a disponibilidade, o ciclo de vida e o preço das suas instâncias. Se você entender esses modelos, poderá escolher a melhor opção para sua carga de trabalho.

Modelos de provisionamento disponíveis

Ao criar uma instância de computação, é possível especificar um dos seguintes modelos de provisionamento. Se você não especificar um modelo de provisionamento, o Compute Engine usará o modelo padrão por padrão.

Padrão
Spot
Início flexível (pré-lançamento)
Vinculada à reserva

A tabela a seguir ajuda a comparar os casos de uso e os preços de cada modelo de provisionamento:

	Padrão	Spot	Início flexível (pré-lançamento)	Vinculada à reserva
Resumo	Com base na disponibilidade de recursos, é possível criar instâncias imediatamente. Você pode controlar quando interromper ou excluir instâncias.	Com base na disponibilidade de recursos, é possível criar instâncias imediatamente. Você pode controlar quando interromper ou excluir instâncias. No entanto, você também permite que o Compute Engine interrompa ou exclua instâncias a qualquer momento para recuperar a capacidade.	Depois de criar um grupo gerenciado de instâncias (MIG) zonal, peça ao Compute Engine para adicionar instâncias com GPUs anexadas ao MIG. O Compute Engine programa o provisionamento das instâncias com base na disponibilidade de recursos. Você pode controlar quando excluir instâncias. No entanto, não é possível interromper, suspender ou recriar esses itens. As instâncias são executadas por até sete dias. Em seguida, o Compute Engine os exclui.	É possível solicitar a reserva de capacidade em uma data futura para criar instâncias com GPUs anexadas. Se Google Cloud aprovar sua solicitação, o Compute Engine vai criar uma reserva. No início do período de reserva, é possível consumir a reserva criando instâncias de GPU que correspondam a ela. Durante o período de reserva aprovado, é possível parar, reiniciar, excluir e recriar instâncias para consumir a reserva conforme necessário. Quando o período de reserva termina, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias que a consomem.
Casos de uso	Ideal para cargas de trabalho que exigem estabilidade e operação contínua, como: Servidores da Web Bancos de dados Aplicativos empresariais Desenvolvimento e teste	Ideal para cargas de trabalho que podem tolerar interrupções, como as seguintes: Processamento em lote Computação de alto desempenho (HPC) Integração e implantação contínuas (CI/CD) Análise de dados Codificação de mídia Inferência on-line	Cargas de trabalho que exigem estabilidade e precisam ser executadas por no máximo sete dias, como as seguintes: Pré-treinamento de modelo pequeno Ajuste de modelos Simulação de HPC Inferência em lote	Ideal para cargas de trabalho que exigem estabilidade e um tempo de execução específico, como: Para cargas de trabalho que duram até 90 dias: Jobs de pré-treinamento de modelo Jobs de ajuste de modelo Cargas de trabalho de simulação de HPC Aumentos esperados de curto prazo nas cargas de trabalho de inferência Para cargas de trabalho com mais de 90 dias: Cargas de trabalho de treinamento Cargas de trabalho de inferência
Preços	Você paga os preços padrão das instâncias. Para mais informações, consulte Preços de instâncias de VM.	A maioria das vCPUs, GPUs e SSDs locais está disponível com um desconto de 60% a 91%. Para mais informações, consulte Preços das VMs spot.	Com base na família de máquinas usada pelas suas instâncias, você recebe até 53% de desconto em vCPUs e GPUs. Consulte Preços do Dynamic Workload Scheduler (DWS).	Com base na família de máquinas usada pelas suas instâncias, você recebe até 53% de desconto em vCPUs e GPUs. Além disso, você vai receber cobranças com base em como reserva capacidade para criar instâncias da seguinte forma: Se você reservar capacidade no Hipercomputador de IA, vai receber cobranças com base nos preços das VMs otimizadas para aceleradores. Se você reservar capacidade usando reservas futuras no modo de calendário, vai receber cobranças com base nos preços do Dynamic Workload Scheduler (DWS).
Cota	Quando você cria uma instância, a cota padrão é consumida.	Quando você cria uma instância, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida. Os créditos do Nível gratuito doGoogle Cloud não se aplicam às VMs spot.	Quando o MIG adiciona instâncias ao grupo, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida.	A cota não se aplica ao modelo de provisionamento vinculado à reserva.

Disponibilidade e vida útil da instância

A tabela a seguir mostra a disponibilidade e o ciclo de vida das instâncias de computação para cada modelo de provisionamento:

	Padrão	Spot	Início flexível (pré-lançamento)	Vinculada à reserva
Pré-requisitos de criação	Não há pré-requisitos para a criação.	Não há pré-requisitos para a criação.	Não há pré-requisitos para a criação.	Para criar instâncias, primeiro reserve capacidade usando um dos seguintes métodos: Para reservar capacidade para cargas de trabalho de longa duração, use as reservas futuras para o AI Hypercomputer. Para reservar capacidade para cargas de trabalho que são executadas por até 90 dias, use reservas futuras no modo de agenda. Na data e hora de entrega escolhidas, o Compute Engine provisiona a capacidade solicitada. Em seguida, você pode consumir a capacidade criando instâncias.
Série de máquinas compatível	É possível usar qualquer série de máquinas, exceto A4X, A4 e A3 Ultra.	É possível usar qualquer série de máquinas, exceto as seguintes: M2 e M3 Instâncias bare metal	Você só pode usar as seguintes séries de máquinas: Série de máquinas com otimização de acelerador Instâncias de máquina virtual (VM) N1 com GPUs anexadas	Dependendo de como você reserva capacidade para criar VMs, só é possível usar as seguintes séries de máquinas: Se você reservar capacidade no AI Hypercomputer, só poderá usar as séries de máquinas A4X, A4 e A3 Ultra. Se você criar uma reserva adiantada no modo de calendário, só poderá usar as séries de máquinas A4 e A3 Ultra.
Disponibilidade da instância	É possível criar instâncias a qualquer momento, desde que os recursos solicitados estejam disponíveis.	É possível criar instâncias a qualquer momento, desde que os recursos solicitados estejam disponíveis.	Só é possível criar instâncias criando solicitações de redimensionamento em um MIG. O Compute Engine usa o DWS para programar o provisionamento da capacidade solicitada com base na disponibilidade de recursos. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs.	Só é possível criar instâncias depois de reservar capacidade para uma data futura. Na data solicitada, o Compute Engine entrega a capacidade pedida, que pode ser usada para criar instâncias. Se você reservar recursos usando reservas adiantadas no modo de calendário, o Compute Engine usará DWS para provisionar a capacidade solicitada. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs.
Ciclo de vida da instância	Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos: Se o tipo de máquina usado pela instância não for compatível com a migração em tempo real, o Compute Engine vai interromper as instâncias durante os eventos de manutenção do host. Em casos raros, a instância pode ser interrompida devido a um erro do host.	Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos: O Compute Engine pode interromper ou excluir a instância a qualquer momento para recuperar a capacidade. Esse processo é chamado de preempção. Se o tipo de máquina usado pela instância não for compatível com a migração em tempo real, o Compute Engine vai interromper as instâncias durante os eventos de manutenção do host. Em casos raros, a instância pode ser interrompida devido a um erro do host.	As instâncias provisionadas são executadas durante o período escolhido, que pode ser de até sete dias. Não é possível interromper, suspender ou recriar instâncias. O Compute Engine exclui instâncias quando uma das seguintes situações acontece: Você solicita a exclusão de instâncias. As instâncias atingem o fim da duração da execução.	Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos: O Compute Engine interrompe a instância durante eventos de manutenção do host. A reserva criada automaticamente para provisionar a capacidade solicitada atinge o fim do período de reserva comprometida. Nesse momento, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias que a consomem. Em casos raros, a instância pode ser interrompida devido a um erro do host.

A seguir

Leia uma visão geral da criação de instâncias do Compute Engine.
Para criar instâncias usando o modelo de provisionamento spot, consulte VMs spot.
Para criar instâncias usando o modelo de provisionamento de início flexível, consulte Sobre solicitações de redimensionamento em um MIG.
Para reservar capacidade e criar instâncias usando o modelo vinculado à reserva, consulte uma das seguintes opções:
- Sobre as solicitações de reserva adiantada no modo de agenda
- Reservar capacidade no hipercomputador de IA

Modelos de provisionamento de instâncias do Compute Engine Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Modelos de provisionamento disponíveis

Disponibilidade e vida útil da instância

A seguir

Modelos de provisionamento de instâncias do Compute Engine