Modelos de provisionamento de instâncias do Compute Engine


Neste documento, descrevemos os modelos de provisionamento para instâncias do Compute Engine. Para saber mais sobre as opções de implantação, consulte Escolher uma estratégia de implantação do Compute Engine para sua carga de trabalho.

Os modelos de provisionamento determinam a disponibilidade, o ciclo de vida e o preço das suas instâncias. Se você entender esses modelos, poderá escolher a melhor opção para sua carga de trabalho.

Modelos de provisionamento disponíveis

Ao criar uma instância de computação, é possível especificar um dos seguintes modelos de provisionamento. Se você não especificar um modelo de provisionamento, o Compute Engine usará o modelo padrão por padrão.

A tabela a seguir ajuda a comparar os casos de uso e os preços de cada modelo de provisionamento:

Padrão Spot Início flexível (pré-lançamento) Vinculada à reserva
Resumo
  • Com base na disponibilidade de recursos, é possível criar instâncias imediatamente.
  • Você pode controlar quando interromper ou excluir instâncias.
  • Com base na disponibilidade de recursos, é possível criar instâncias imediatamente.
  • Você pode controlar quando interromper ou excluir instâncias. No entanto, você também permite que o Compute Engine interrompa ou exclua instâncias a qualquer momento para recuperar a capacidade.
  • Depois de criar um grupo gerenciado de instâncias (MIG) zonal, peça ao Compute Engine para adicionar instâncias com GPUs anexadas ao MIG. O Compute Engine programa o provisionamento das instâncias com base na disponibilidade de recursos.
  • Você pode controlar quando excluir instâncias. No entanto, não é possível interromper, suspender ou recriar esses itens. As instâncias são executadas por até sete dias. Em seguida, o Compute Engine os exclui.
  • É possível solicitar a reserva de capacidade em uma data futura para criar instâncias com GPUs anexadas. Se Google Cloud aprovar sua solicitação, o Compute Engine vai criar uma reserva. No início do período de reserva, é possível consumir a reserva criando instâncias de GPU que correspondam a ela.
  • Durante o período de reserva aprovado, é possível parar, reiniciar, excluir e recriar instâncias para consumir a reserva conforme necessário. Quando o período de reserva termina, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias que a consomem.
Casos de uso Ideal para cargas de trabalho que exigem estabilidade e operação contínua, como:
  • Servidores da Web
  • Bancos de dados
  • Aplicativos empresariais
  • Desenvolvimento e teste
Ideal para cargas de trabalho que podem tolerar interrupções, como as seguintes:
  • Processamento em lote
  • Computação de alto desempenho (HPC)
  • Integração e implantação contínuas (CI/CD)
  • Análise de dados
  • Codificação de mídia
  • Inferência on-line
Cargas de trabalho que exigem estabilidade e precisam ser executadas por no máximo sete dias, como as seguintes:
  • Pré-treinamento de modelo pequeno
  • Ajuste de modelos
  • Simulação de HPC
  • Inferência em lote
Ideal para cargas de trabalho que exigem estabilidade e um tempo de execução específico, como:
  • Para cargas de trabalho que duram até 90 dias:
    • Jobs de pré-treinamento de modelo
    • Jobs de ajuste de modelo
    • Cargas de trabalho de simulação de HPC
    • Aumentos esperados de curto prazo nas cargas de trabalho de inferência
  • Para cargas de trabalho com mais de 90 dias:
    • Cargas de trabalho de treinamento
    • Cargas de trabalho de inferência
Preços Você paga os preços padrão das instâncias. Para mais informações, consulte Preços de instâncias de VM. A maioria das vCPUs, GPUs e SSDs locais está disponível com um desconto de 60% a 91%. Para mais informações, consulte Preços das VMs spot. Com base na família de máquinas usada pelas suas instâncias, você recebe até 53% de desconto em vCPUs e GPUs. Consulte Preços do Dynamic Workload Scheduler (DWS). Com base na família de máquinas usada pelas suas instâncias, você recebe até 53% de desconto em vCPUs e GPUs. Além disso, você vai receber cobranças com base em como reserva capacidade para criar instâncias da seguinte forma:
Cota Quando você cria uma instância, a cota padrão é consumida. Quando você cria uma instância, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida. Os créditos do Nível gratuito doGoogle Cloud não se aplicam às VMs spot. Quando o MIG adiciona instâncias ao grupo, a cota preemptiva é consumida. Se o projeto não tiver uma cota preemptiva, a cota padrão será consumida. A cota não se aplica ao modelo de provisionamento vinculado à reserva.

Disponibilidade e vida útil da instância

A tabela a seguir mostra a disponibilidade e o ciclo de vida das instâncias de computação para cada modelo de provisionamento:

Padrão Spot Início flexível (pré-lançamento) Vinculada à reserva
Pré-requisitos de criação Não há pré-requisitos para a criação. Não há pré-requisitos para a criação. Não há pré-requisitos para a criação.

Para criar instâncias, primeiro reserve capacidade usando um dos seguintes métodos:

Na data e hora de entrega escolhidas, o Compute Engine provisiona a capacidade solicitada. Em seguida, você pode consumir a capacidade criando instâncias.
Série de máquinas compatível É possível usar qualquer série de máquinas, exceto A4X, A4 e A3 Ultra. É possível usar qualquer série de máquinas, exceto as seguintes:
  • M2 e M3
  • Instâncias bare metal
Você só pode usar as seguintes séries de máquinas:
Dependendo de como você reserva capacidade para criar VMs, só é possível usar as seguintes séries de máquinas:
Disponibilidade da instância É possível criar instâncias a qualquer momento, desde que os recursos solicitados estejam disponíveis. É possível criar instâncias a qualquer momento, desde que os recursos solicitados estejam disponíveis. Só é possível criar instâncias criando solicitações de redimensionamento em um MIG. O Compute Engine usa o DWS para programar o provisionamento da capacidade solicitada com base na disponibilidade de recursos. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs. Só é possível criar instâncias depois de reservar capacidade para uma data futura. Na data solicitada, o Compute Engine entrega a capacidade pedida, que pode ser usada para criar instâncias. Se você reservar recursos usando reservas adiantadas no modo de calendário, o Compute Engine usará DWS para provisionar a capacidade solicitada. O DWS ajuda você a conseguir recursos de alta demanda, como GPUs.
Ciclo de vida da instância Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos:
  • Se o tipo de máquina usado pela instância não for compatível com a migração em tempo real, o Compute Engine vai interromper as instâncias durante os eventos de manutenção do host.
  • Em casos raros, a instância pode ser interrompida devido a um erro do host.
Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos:
  • O Compute Engine pode interromper ou excluir a instância a qualquer momento para recuperar a capacidade. Esse processo é chamado de preempção.
  • Se o tipo de máquina usado pela instância não for compatível com a migração em tempo real, o Compute Engine vai interromper as instâncias durante os eventos de manutenção do host.
  • Em casos raros, a instância pode ser interrompida devido a um erro do host.
As instâncias provisionadas são executadas durante o período escolhido, que pode ser de até sete dias. Não é possível interromper, suspender ou recriar instâncias.

O Compute Engine exclui instâncias quando uma das seguintes situações acontece:
  • Você solicita a exclusão de instâncias.
  • As instâncias atingem o fim da duração da execução.
Você pode controlar quando interromper ou excluir uma instância, exceto nos seguintes casos:
  • O Compute Engine interrompe a instância durante eventos de manutenção do host.
  • A reserva criada automaticamente para provisionar a capacidade solicitada atinge o fim do período de reserva comprometida. Nesse momento, o Compute Engine exclui a reserva e interrompe ou exclui todas as instâncias que a consomem.
  • Em casos raros, a instância pode ser interrompida devido a um erro do host.

A seguir