模擬主機維護事件


本頁說明如何測試 Compute Engine 執行個體的主機維護政策對應用程式的影響。

您可以模擬 VM 的維護事件,測試下列項目:

  • 即時遷移對應用程式的影響。
  • 使用一或多個 Spot VM 時,應用程式和批次作業如何處理先占和關閉作業。
  • 應用程式如何處理執行個體的關機和重新啟動程序。這些執行個體已設定在維護事件期間終止並重新啟動,而不是即時遷移。
  • 瞭解在單一租戶節點上執行的工作負載在主機維護事件期間的行為,並查看單一租戶 VM 的主機維護政策對 VM 上執行的應用程式有何影響。

如果嘗試在不支援即時遷移的執行個體上模擬主機維護事件,系統會根據設定的主機維護政策終止或重新啟動執行個體。

事前準備

  • 請參閱 SimulateMaintenanceEventRequestsPerMinutePerProjectPerRegion區域 API 使用頻率限制
  • 如果尚未設定驗證,請先完成設定。 「驗證」是指驗證身分的程序,確認您有權存取 Google Cloud 服務和 API。如要從本機開發環境執行程式碼或範例,請選取下列其中一個選項,向 Compute Engine 進行驗證:

    Select the tab for how you plan to use the samples on this page:

    gcloud

      1. After installing the Google Cloud CLI, initialize it by running the following command:

        gcloud init

        If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

      2. Set a default region and zone.
      3. REST

        如要在本機開發環境中使用本頁的 REST API 範例,請使用您提供給 gcloud CLI 的憑證。

          After installing the Google Cloud CLI, initialize it by running the following command:

          gcloud init

          If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

        詳情請參閱 Google Cloud 驗證說明文件中的「Authenticate for using REST」。

限制

  • 如要在主機維護政策設為「在節點群組中遷移」的單一租戶節點群組上,正確模擬維護事件,您必須依序在每個節點上觸發維護事件。
  • 如果是單一租戶節點群組,當您嘗試模擬主機維護事件,且節點群組的主機維護政策設為在節點群組內遷移時:
    • 如果指定的節點數量小於或等於預留的保留節點總數,主機維護事件模擬就會同時針對所有指定節點執行。
    • 如果指定的節點數量大於保留的暫緩節點總數,模擬就會失敗。
  • 每個區域每分鐘可啟動的維護事件模擬次數,會受到 simulate_maintenance_event_requests_per_region 指標的 API 頻率限制

模擬主機維護事件,測試即時遷移

您可以透過 Google Cloud CLI 或 API 要求,模擬運算執行個體的維護事件。這項模擬活動包含一般維護作業中會進行的各種維護活動。這樣一來,您就能觀察端對端程序,並測試可能已導入的任何自動化功能。

模擬使用即時遷移的執行個體主機維護事件時,執行個體的 maintenance-event 中繼資料鍵會經歷下列變更:

  1. 在模擬開始時,maintenance-event 中繼資料鍵的值會從 NONE 變更為 MIGRATE_ON_HOST_MAINTENANCE
  2. 在模擬事件期間,值會保持為 MIGRATE_ON_HOST_MAINTENANCE
  3. 模擬結束後,值會恢復為 NONE

如要查詢維護事件鍵,請參閱「查詢維護事件中繼資料鍵」。

gcloud

使用 compute instances simulate-maintenance-event 指令模擬執行個體的維護事件,並測試所設定的主機維護政策設定:

gcloud compute instances simulate-maintenance-event INSTANCE_NAME \
    --zone=ZONE --with-extended-notifications=True

更改下列內容:

  • INSTANCE_NAME:您要模擬維護事件的運算執行個體名稱。

    您可以指定多個執行個體名稱 (以單一空格分隔),在位於相同區域的多個執行個體上模擬維護作業。例如 instance-1 instance-2 instance-3

  • ZONE:執行個體所在的區域。

REST

建構對compute.instances.simulateMaintenanceEvent 方法POST 要求:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/INSTANCE_NAME/simulateMaintenanceEvent

更改下列內容:

  • PROJECT_ID:這項要求的專案 ID。
  • INSTANCE_NAME:要模擬維護事件的執行個體名稱。
  • ZONE:執行個體所在的區域。

模擬終止的 Compute 執行個體主機維護作業

您可以透過 Google Cloud CLI 或 API 要求,模擬運算執行個體的維護事件。這項模擬活動包含一般維護作業中會進行的各種維護活動。這樣一來,您就能觀察端對端程序,並測試可能已導入的任何自動化功能。

此外,您也可以搭配支援的機器類型使用 --with-extended-notifications 參數,在模擬事件期間手動測試啟動主機維護作業。

gcloud

  1. 使用 compute instances simulate-maintenance-event 指令模擬執行個體的維護事件,並測試所設定的主機維護政策設定。您可以選擇加入 --with-extended-notifications 旗標。

    gcloud compute instances simulate-maintenance-event INSTANCE_NAME \
       --zone=ZONE --with-extended-notifications=True
    

    更改下列內容:

    • INSTANCE_NAME:您要模擬維護事件的運算執行個體名稱。

      您可以指定多個執行個體名稱 (以單一空格分隔),在位於相同區域的多個執行個體上模擬維護作業。例如 instance-1 instance-2 instance-3

    • ZONE:執行個體所在的區域。

  2. 選用:如要手動啟動模擬維護事件,請使用 compute instances perform-maintenance 指令

    gcloud compute instances perform-maintenance INSTANCE_NAME \
       --zone=ZONE
    

    更改下列內容:

    • INSTANCE_NAME:您要模擬維護事件的運算執行個體名稱。

      您可以指定多個執行個體名稱 (以單一空格分隔),在位於相同區域的多個執行個體上模擬維護作業。例如 instance-1 instance-2 instance-3

    • ZONE:執行個體所在的區域。

REST

  1. 建構對 compute.instances.simulateMaintenanceEvent 方法POST 要求。您可以選擇加入查詢參數 withExtendedNotifications

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/INSTANCE_NAME/simulateMaintenanceEvent?withExtendedNotifications=True
    

    更改下列內容:

    • PROJECT_ID:這項要求的專案 ID。
    • INSTANCE_NAME:要模擬維護事件的執行個體名稱。
    • ZONE:執行個體所在的區域。
  2. 選用:如要手動啟動模擬維護事件,請向 compute.instances.performMaintenance 方法建構 POST 要求

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/INSTANCE_NAME/performMaintenance
    

    更改下列內容:

    • INSTANCE_NAME:要啟動維護事件的運算執行個體名稱。

      您可以指定多個執行個體名稱 (以單一空格分隔),在位於相同區域的多個執行個體上執行維護作業。例如 instance-1 instance-2 instance-3

    • ZONE:執行個體所在的區域。

在單一用戶群節點上模擬主機維護事件

您可以透過 Google Cloud CLI 或 API 要求,在單一租戶節點上模擬主機維護作業。在單一租戶 VM 上模擬主機維護事件時,maintenance-event 中繼資料鍵值不會變更,在整個模擬過程中都會維持 NONE

gcloud

執行 sole-tenancy node-groups simulate-maintenance-event 指令,強制單一租戶節點啟用所設定的維護政策:

 gcloud compute sole-tenancy node-groups simulate-maintenance-event NODE_GROUP \
    --nodes=NODE_NAMES \
    --zone=ZONE \
    --async

更改下列內容:

  • NODE_GROUP:要模擬維護事件的節點群組名稱。

  • NODE_NAMES:要模擬維護事件的節點名稱。指定多個節點名稱時,請使用以半形逗號分隔的值,例如 node-1,node-2,node-3

  • ZONE:節點所在的可用區。

REST

建構對compute.nodeGroups.simulateMaintenanceEvent 方法POST 要求:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/nodeGroups/NODE_GROUP/simulateMaintenanceEvent

{
  "nodes": [
      "NODE_NAMES"
  ]
}

更改下列內容:

  • PROJECT_ID:這項要求的專案 ID。
  • ZONE:節點所在的可用區。
  • NODE_GROUP:要模擬維護事件的節點群組名稱。
  • NODE_NAMES:要模擬維護作業的節點名稱。以雙引號括住節點名稱,例如 "node-1"。指定多個節點名稱時,請使用以半形逗號分隔的值,例如 "node-1","node-2","node-3"

後續步驟