CPU 平台


使用 Compute Engine 建立虛擬機器 (VM) 或裸機執行個體時,您需要為執行個體指定機器系列和機器類型。每個機器系列都與一或多個 CPU 平台相關聯。 如果機器系列有多個 CPU 平台可用,您可以為運算執行個體選取最低 CPU 平台。

CPU 平台提供多個實體處理器,每個處理器都稱為核心。在 Compute Engine 上可用的處理器中,單一 CPU 核心可透過多執行緒並行 (SMT) 以多個硬體執行緒的形式執行,在 Intel 處理器上則稱為 Intel 超執行緒技術。在 Compute Engine 中,每個硬體執行緒都稱為虛擬 CPU (vCPU)。部分機器系列 (例如 C4A、T2D 和 H3) 不會使用 SMT,而是以每個 vCPU 代表一個核心。當系統向 VM 回報 vCPU 佔用不同的虛擬核心時,Compute Engine 會確認這些 vCPU 絕不會共用相同的實體核心。

運算執行個體的機器類型會指定 vCPU 數量,您可以根據該機器系列的預設每個核心 vCPU 比率,推斷實體 CPU 核心數量:

  • 對於 C4A、Tau T2D、Tau T2A、H3 和 A4X 機器系列,VM 一律會為每個核心配備一個 vCPU。
  • 對於所有其他機器系列,運算執行個體預設每個核心有兩個 vCPU。

您可以選擇將每個核心的執行緒數量設為非預設值 ,這可能對某些工作負載有益。請注意,這麼做之後,運算執行個體的機器類型就不會再反映正確的 vCPU 數量。不過,價格和實體 CPU 核心數量仍與預設的每個核心兩個 vCPU 的比率相同,而 vCPU 數量則是機器類型所指出值的一半。

Arm 處理器

如果是 Arm 處理器,Compute Engine 會為每個核心使用一個執行緒。每個 vCPU 都會對應至沒有 SMT 的實體核心。

下表說明 Compute Engine 執行個體可用的 Arm 處理器。

CPU 處理器 處理器 SKU 支援的機器系列和類型
搭載 Arm Neoverse V2 核心的 NVIDIA Grace 處理器 Superchip A4X
Google Axion 處理器 C4A
Ampere Altra Q64-30 Tau T2A

x86 處理器

對於大多數 x86 處理器,每個 vCPU 都會實作為單一硬體執行緒。H3 機器系列是例外,一個 vCPU 代表一個實體核心。

Intel 處理器

在 Intel Xeon 處理器上,Intel 超執行緒技術支援在每個核心上同時執行多個執行緒。運算執行個體的機器類型會決定 vCPU 數量和記憶體大小。

CPU 處理器 處理器 SKU 支援的機器系列和類型 基本頻率 (GHz) 所有核心 Turbo 頻率 (GHz) 單一核心最高 Turbo 頻率 (GHz)
Intel Xeon 可擴充處理器
(Granite Rapids)
第 6 代
Intel® Xeon® Platinum 6985P-C 處理器
2.81 3.9 4.2
Intel Xeon 可擴充處理器
(Emerald Rapids)
第 5 代
Intel Xeon Platinum 8581C 處理器
2.1 2.9 4.0
2.3 3.1 4.0
2.1 2.9 3.3
Intel Xeon 可擴充處理器
(Sapphire Rapids)
第 4 代
Intel Xeon Platinum 8490H 處理器 1.9 2.9 3.5
Intel Xeon Platinum 8481C 處理器 2.2 3.0 3.0
2.2 3.0 3.8
2.0 3.8 2.9
Intel Xeon 可擴充處理器 (Ice Lake)
第 3 代
Intel Xeon Platinum
8373C 處理器
2.6 3.4 3.5
Intel Xeon 可擴充處理器 (Cascade Lake)
第 2 代
Intel Xeon Gold 6268CL 處理器 2.8 3.4 3.9
Intel Xeon Gold 6253CL 處理器 3.1 3.8 3.9
Intel Xeon Platinum 8280L 處理器 2.5 3.4 4.0
Intel Xeon Platinum 8273CL 處理器 2.2 2.9 3.7
Intel Xeon 可擴充處理器 (Skylake)
第一代
Intel Xeon 可擴充白金級 8173M 處理器 2.0 2.7 3.5
Intel Xeon E7 (Broadwell E7) Intel Xeon E7-8880V4 處理器 2.2 2.6 3.3
Intel Xeon E5 v4 (Broadwell E5) Intel Xeon E5-2696V4 處理器 2.2 2.8 3.7
Intel Xeon E5 v3 (Haswell) Intel Xeon E5-2696V3 處理器 2.3 2.8 3.8
Intel Xeon E5 v2 (Ivy Bridge) Intel Xeon E5-2696V2 處理器 2.5 3.1 3.5
Intel Xeon E5 (Sandy Bridge) Intel Xeon E5-2689 處理器 2.6 3.2 3.6

1使用 Intel Granite Rapids CPU 的 C4 機型基本頻率為 2.8,但 vPMU 會為了相容性而顯示 2.3。

2如果 N2 機器類型有 96 個以上的 vCPU,則需要 Intel Ice Lake CPU。

AMD 處理器

AMD 處理器可透過 SMT 提供最佳化的效能和擴充性。在幾乎所有情況下,Compute Engine 每個核心會使用兩個執行緒,而每個 vCPU 都是一個執行緒。Tau T2D 是例外情況,Compute Engine 會為每個核心使用一個執行緒,且每個 vCPU 會對應至一個實體核心。運算執行個體的機器類型會決定 vCPU 數量和記憶體大小。

CPU 處理器 處理器 SKU 支援的機器系列 基本頻率 (GHz) 有效頻率 (GHz) 最高加速頻率 (GHz)
AMD EPYC Turin
第 5 代
AMD EPYC™ 9B45 2.7 3.5 4.1
AMD EPYC Genoa
第 4 代
AMD EPYC™ 9B14 2.6 3.3 3.7
AMD EPYC Milan
第 3 代
AMD EPYC™ 7B13 2.45 2.8 3.5
AMD EPYC Rome
第 2 代
AMD EPYC™ 7B12 2.25 2.7 3.3

頻率行為

上表說明 Compute Engine 提供的 CPU 硬體規格,但請注意下列事項:

  • 頻率:電腦的頻率或時脈速度,用來測量 CPU 每秒執行的週期數,以 GHz (十億赫茲) 為單位。一般來說,頻率越高,效能越好。不過,不同 CPU 設計處理指令的方式不同,因此時脈速度較高的舊 CPU,效能可能會不如時脈速度較低的 CPU,因為新架構處理指令的效率較高。

  • 基本頻率:系統閒置或負載較輕時,CPU 的運作頻率。CPU 以基本頻率運作時,耗電量較少,產生的熱能也較少。

    無論 CPU 實際執行的頻率為何,運算執行個體的訪客環境一律會反映基本頻率。

  • 全核心 Turbo 頻率:在通訊端中所有核心同時皆非處於閒置狀態的情況下,各 CPU 執行作業的正常頻率。不同的工作負載對系統 CPU 的要求也不同。Boost 技術可解決這項差異,並透過提高 CPU 頻率,協助程序配合工作負載需求進行調整。

    • 即使訪客環境只顯示基本頻率的公告資訊,大部分的運算執行個體也會獲得所有核心 Turbo 頻率。
    • Ampere Altra Arm 處理器可提供更可預測的效能,因為 Arm 處理器的頻率一律為全核心渦輪加速頻率。
    • C4 執行個體可將 AdvancedMachineFeature 欄位設為 ALL_CORE_MAX,以全核心最高 Turbo 頻率執行。如未設定這個欄位,VM 會以預設設定 (無限制頻率) 執行。

      C4D 或 C4A 機器執行個體不支援 ALL_CORE_MAX 設定。

  • 最大渦輪頻率:CPU 在受到高需求應用程式 (例如電玩遊戲或設計模型應用程式) 壓力時的目標頻率。這是指 CPU 在不超頻的情況下,可達到的單一核心最高頻率。

  • 處理器電源管理技術:Intel 處理器支援多種技術,可最佳化耗電量。這些技術分為兩類或兩種狀態:

    • C 狀態是指 CPU 減少或關閉選定功能時的狀態。
    • P 狀態可調整處理器運作的頻率和電壓,進而降低 CPU 耗電量。

    所有 C4 機器類型,以及特定 C2 (30、60 個 vCPU)、C2D (56、112 個 vCPU) 和 M2 (208、416 個 vCPU) 機器類型,都支援透過 MWAIT 指令提供例項 C-State 提示。

    Compute Engine 執行個體不會提供任何設施,供客戶控管 P 狀態。

CPU 功能

晶片製造商會在生產的 CPU 中加入運算、繪圖、虛擬化和記憶體管理等進階技術。 Google Cloud支援在 Compute Engine 中使用部分進階功能。

進階向量擴充功能

進階向量擴充功能 (AVX) 是單指令多資料 (SIMD) 擴充功能,適用於 Intel 和 AMD 微處理器的 x86 指令集架構。AVX 提供新指令和新編碼架構。

詳情請參閱「進階向量擴充功能」。

Compute Engine 使用的所有 x86 處理器都支援 AVX。

進階向量擴充功能 (AVX2)

AVX2 (也稱為 Haswell 新指令) 在 AVX 中新增了下列項目:

  • 將大多數向量整數 SSE 和 AVX 指令擴充至 256 位元
  • 新增 Gather 支援,可從不連續的記憶體位置載入向量元素
  • 以 DWORD 和 QWORD 粒度進行任意對任意的排列
  • 向量變化

AVX2 適用於下列 CPU 平台:

  • Intel Xeon E5 v3 (Haswell) 和更新的處理器
  • 所有 AMD 處理器

進階向量擴充功能 (AVX512)

AVX-512 使用 EVEX 前置字元編碼,將 AVX 擴充至 512 位元支援。AVX-512 內建加速功能,可處理需要大量向量處理的嚴苛工作負載。AVX-512 加速器的較大暫存器支援 32 個雙精度和 64 個單精度浮點數,以及八個 64 位元和 16 個 32 位元整數。

如要進一步瞭解 AVX-512,請參閱「什麼是 Intel AVX-512?」。

AVX-512 適用於下列 CPU 平台:

  • Intel Xeon 可擴充處理器 (Skylake) 第 1 代和更新的處理器
  • AMD EPYC Genoa 第 4 代以上處理器

進階矩陣擴充功能

Intel Advanced Matrix Extensions (AMX) 是全新的指令集架構 (ISA) 擴充功能,旨在加速人工智慧 (AI) 和機器學習 (ML) 工作負載。AMX 導入了新指令,可用於執行矩陣乘法和捲積運算,這兩項是 AI 和 ML 中最常見的運算。

AMX 導入稱為「圖塊」的 2 維暫存器,加速器可在這些暫存器上執行作業。AMX 的設計宗旨是可擴充架構,第一個實作的加速器稱為「分塊矩陣乘法單元」(TMUL)。Sapphire Rapids 處理器的每個 CPU 核心都有獨立的 AMX TMUL 單元。

如要瞭解 Intel AMX 的技術細節,請參閱 5.16 中的 Intel AMX 支援。如需 AMX 教學課程,請參閱 Intel 提供的程式碼範例:Intel Advanced Matrix Extensions (Intel AMX) - Intrinsics Functions

AMX 適用於第 4 代 Intel Xeon (Sapphire Rapids) 以上的處理器。AMX 不適用於 AMD 或 Arm 處理器。

使用 AMX 的需求條件

Intel AMX 指令有特定軟體最低需求,例如:

  • 如果是自訂映像檔,AMX 支援 Linux 核心版本 5.16 以上。
  • Compute Engine 在下列公開映像檔中支援 AMX:
    • CentOS Stream 8 以上版本
    • Container-Optimized OS 109 LTS 以上版本
    • RHEL 8 (最新版本) 以上版本
    • Rocky Linux 8 (最新版本) 以上版本
    • Ubuntu 22.04 以上版本
    • Windows Server 2022 以上版本
  • Tensorflow 2.9.1 以上版本
  • Intel Optimization for PyTorch 的 Intel 擴充功能

Bare Metal 執行個體可用的 CPU 功能

除了提供伺服器的所有原始運算資源外,在第 4 代和後續的 Intel Xeon Scalable 處理器上執行的裸機執行個體,還可以使用多個板載、特定功能的加速器和卸載:

  • Intel-QAT:Intel QuickAssist Technology (Intel QAT) 可加速壓縮、加密和解密作業
  • Intel-DLB:Intel Dynamic Load Balancer (Intel DLB) 有助於加快資料佇列速度
  • Intel IAA:Intel 記憶體內分析加速器 (Intel IAA) 可提升查詢處理效能。
  • Intel DSA:Intel Data Streaming Accelerator (Intel DSA) 可協助加快資料複製和移動速度。

機密運算

如要保護使用中的資料,可以使用支援機密運算技術的 CPU 平台,建立機密 VM 執行個體。

如要進一步瞭解建立機密 VM 執行個體的需求條件,請參閱支援的設定

後續步驟

歡迎試用

如果您未曾使用過 Google Cloud,歡迎建立帳戶,親自體驗實際使用 Compute Engine 的成效。新客戶可以獲得價值 $300 美元的免費抵免額,可用於執行、測試及部署工作負載。

免費試用 Compute Engine