自 2025 年 4 月 29 日起，Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型將無法用於先前未使用這些模型的專案，包括新專案。詳情請參閱「模型版本和生命週期」。

本頁面由 Cloud Translation API 翻譯而成。

在 Vertex AI 中建構及部署 AI 模型的費用

價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，則會按照 Cloud Platform SKU 頁面列出的相應貨幣價格計費。

您只需為傳回 200 回應代碼的要求付費。傳回 4xx 和 5xx 等其他回應代碼的要求，不會收取輸入或輸出費用。

本頁面說明 Vertex AI 的生成式 AI 定價。如要瞭解所有其他 Vertex AI 定價 (包括機器學習平台和機器學習運作服務)，請參閱 Vertex AI 定價頁面。

Google 模型

Gemini 2.5

模型	類型	價格 (每 100 萬個符記) 不超過 20 萬個輸入符記	價格 (每 100 萬個符記) > 20 萬個輸入符記	價格 (每 100 萬個符記) <= 20 萬個符記，使用批次 API 輸入	價格 (每 100 萬個符記) > 20 萬個輸入符記，使用批次 API
Gemini 2.5 Pro
	輸入內容 (文字、圖片、影片、音訊)	$1.25 美元	$2.5 美元	$0.625 美元	$1.25 美元
	文字輸出內容 (回應和推論)	$10 美元	$15	$5 美元	$7.5
Gemini 2.5 正式發布版 Flash
	輸入內容 (文字、圖片、影片)	$0.30 美元	$0.30 美元	$0.15 美元	$0.15 美元
	音訊輸入	$1 美元	$1 美元	$0.5	$0.5
	文字輸出	$2.50 美元	$2.50 美元	$1.25 美元	$1.25 美元
	為 100 萬個訓練符記調整	$5.00 美元	不適用	不適用	不適用
Gemini 2.5 Flash 預先發布版 (端點已於 2025 年 7 月 15 日淘汰)
	輸入內容 (文字、圖片、影片)	$0.15 美元	$0.15 美元	$0.075 美元	$0.075 美元
	音訊輸入	$1 美元	$1 美元	$0.5	$0.5
	文字輸出內容 (不需思考)	$0.60 美元	$0.60 美元	$0.30 美元	$0.30 美元
	文字輸出 (思考、回應和推理)	$3.50 美元	$3.50 美元	$1.75	$1.75
Gemini 2.5 Flash Live API
	100 萬個輸入文字符記	$0.5	$0.5	不適用	不適用
	100 萬個輸入音訊符記	$3 美元	$3 美元	不適用	不適用
	100 萬個輸入影片詞元	$3 美元	$3 美元	不適用	不適用
	100 萬個輸出文字詞元	$2 美元	$2 美元	不適用	不適用
	100 萬個輸出音訊詞元	$12 美元	$12 美元	不適用	不適用
Gemini 2.5 Flash Lite
	輸入內容 (文字、圖片、影片)	$0.1 美元	$0.1 美元	不適用	不適用
	音訊輸入	$0.5	$0.5	不適用	不適用
	文字輸出內容 (回應和推論)	$0.4 美元	$0.4 美元	不適用	不適用
利用 Google 搜尋建立基準	Gemini 2.0 Flash、2.5 Flash 和 2.5 Flash-Lite 每天提供 1,500 則實地提示，不需額外付費。Gemini 2.5 Pro 提供每日 10,000 則心平靜和提示，不需額外付費。超過上述限制的實地考察提示將按每 1,000 個實地考察提示$35 美元計費。「具體提示」是指向 Gemini 提交的請求，會向 Google 搜尋發出一或多個查詢&ast;&ast;。即使向 Google 搜尋發送多個搜尋查詢，系統只會收取一次合理提示費用。如需每天超過 100 萬個實地導航提示，請與帳戶團隊聯絡。
企業適用的網站安全防護	每 1,000 個 grounded 提示$45 美元。錨定提示是指向 Gemini 提交的要求，該要求會向企業版 Web Grounding 發出一或多項查詢**。即使向 Google 搜尋發送多個搜尋查詢，系統只會收取一次合理提示費用。如需每天超過 100 萬個實地導航提示，請與帳戶團隊聯絡。
以資料為基準	2025 年 6 月 16 日起，每 1,000 次要求費用為 $2.5 美元。

* 如果查詢輸入內容超過 20 萬個符記，系統會以長文本情境費率收費，計算所有輸入和輸出符記。
** 只有在提示成功傳回網頁結果 (也就是結果中至少包含一個來自網頁的 Grounding 支援網址) 時，才會收取「Grounding with Google Search」和「Web Grounding for enterprise」的費用。另外收取 Gemini 模型使用費。

Gemini 2.0

Gemini 2.0 的計費方式是依據「單位」計算。如要在傳送要求前計算要求中的輸入詞元數，可以使用 SDK 分詞器或 countTokens API。如果要求失敗並傳回 400 或 500 錯誤，您就不會因使用這些權杖而須付費。

使用價目表中的切換按鈕，比較以代碼為基礎和以模式為基礎的定價。

以代幣為基礎的定價方式

模型	類型	費用	使用 Batch API 定價
Gemini 2.0 Flash
	100 萬個輸入內容詞元	$0.15 美元	$0.075 美元
	100 萬個輸入音訊符記	$1.00 美元	$0.50 美元
	100 萬個輸出文字詞元	$0.60 美元	$0.30 美元
	為 100 萬個訓練符記調整	$3.00 美元
Gemini 2.0 Flash 圖片產生功能
	100 萬個輸入內容詞元	$0.15 美元
	100 萬個輸入音訊符記	$1.00 美元
	100 萬個輸入影片詞元	$3 美元
	100 萬個輸出文字詞元	$0.60 美元
	100 萬個輸出圖像詞元	$30.00
Gemini 2.0 Flash Live API
	100 萬個輸入文字符記	$0.5
	100 萬個輸入音訊符記	$3 美元
	100 萬個輸入影片詞元	$3 美元
	100 萬個輸出文字詞元	$2 美元
	100 萬個輸出音訊詞元	$12 美元
Gemini 2.0 Flash Lite
	100 萬個輸入內容詞元	$0.075 美元	$0.0375 美元
	100 萬個輸入音訊符記	$0.075 美元	$0.0375 美元
	100 萬個輸出文字詞元	$0.30 美元	$0.15 美元
	為 100 萬個訓練符記調整	$1.00 美元
利用 Google 搜尋建立基準	Gemini 2.0 Flash 和 2.5 Flash 每天提供 1,500 則放鬆提示，不需額外付費。超過上述限制的實地調查提示將按每 1,000 個實地調查提示$35 美元計費。以事實為依據的提示是指向 Gemini 提交的要求，該要求會向 Google 搜尋發出一或多個查詢*。即使向 Google 搜尋發送多個搜尋查詢，系統只會收取一次合理提示費用。如需每天超過 100 萬則實地導航提示，請與帳戶團隊聯絡。
企業適用的網站安全防護	每 1,000 個 grounded 提示$45 美元。錨定提示是指向 Gemini 提交的要求，該要求會向 Web Grounding for enterprise* 發出一或多項查詢。即使向 Google 搜尋發送多個搜尋查詢，系統只會收取一次合理提示費用。如需每天超過 100 萬則實地導航提示，請與帳戶團隊聯絡。
以資料為基準	2025 年 6 月 16 日起，每 1,000 次要求費用為 $2.5 美元。

以模式為基礎的定價

下列模式定價是根據平均用途計算而得，僅供參考。實際計費只會以代幣為準：

4 個字元會產生約 1 個文字符記 (含空格)。

1024x1024 圖片會消耗 1, 290 個記號。每個圖片的符記數量會因圖片解析度而異。如要進一步瞭解如何計算代幣，請參閱說明文件。

以每秒一張影格的取樣率計算，影片輸入每秒會消耗 258 個單位。影片和音訊帳單，分別列出影片和音訊代幣的使用量。

音訊輸入每秒會消耗 25 個權杖，且不含時間戳記。

模型	類型	費用	使用 Batch API 定價
Gemini 2.0 Flash
	輸入文字 ($/萬個字元)	$0.0375 美元	$0.01875 美元
	輸入圖片 ($/圖片)	$0.0001935 美元	$0.00009675 美元
	輸入影片 ($/秒)	$0.0000387 美元	$0.00001935 美元
	輸入音訊 ($/秒)	$0.000025 美元	$0.0000125 美元
	輸出文字 ($/M 個字元)	$0.15 美元	$0.075 美元
Gemini 2.0 Flash 圖片產生功能
	輸入文字 ($/萬個字元)	$0.0375 美元
	輸入圖片 ($/圖片)	$0.0001935 美元
	輸入影片 ($/秒)	$0.0000387 美元
	輸入音訊 ($/秒)	$0.000025 美元
	輸出文字 ($/M 個字元)	$0.15 美元
	輸出圖片 (每張圖片費用)	$0.04 美元
Gemini 2.0 Flash Lite
	輸入文字 ($/萬個字元)	$0.01875 美元	$0.009375 美元
	輸入圖片 ($/圖片)	$0.00009675 美元	$0.000048375 美元
	輸入影片 ($/秒)	$0.00001935 美元	$0.000009675 美元
	輸入音訊 ($/秒)	$0.000001875 美元	$0.000000938 美元
	輸出文字 ($/M 個字元)	$0.075 美元	$0.0375 美元
利用 Google 搜尋建立基準	Gemini 2.0 Flash 和 2.5 Flash 每天提供 1,500 則放鬆提示，不需額外付費。超過上述限制的實地調查提示將按每 1,000 個實地調查提示$35 美元計費。以事實為依據的提示是指向 Gemini 提交的要求，該要求會向 Google 搜尋發出一或多個查詢*。即使向 Google 搜尋發送多個搜尋查詢，系統只會收取一次合理提示費用。如需每天超過 100 萬則實地導航提示，請與帳戶團隊聯絡。
企業適用的網站安全防護	每 1,000 個 grounded 提示$45 美元。錨定提示是指向 Gemini 提交的要求，該要求會向 Web Grounding for enterprise* 發出一或多項查詢。即使向 Google 搜尋發送多個搜尋查詢，系統只會收取一次合理提示費用。如需每天超過 100 萬則實地導航提示，請與帳戶團隊聯絡。

* 價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* 訓練詞元的計算方式是將訓練資料集中的詞元總數乘以訓練週期數。
* PDF 檔案會以圖片輸入形式計費，每個 PDF 頁面相當於一張圖片。
* 經調校的模型端點的預測價格與基本模型相同。
* 只有當提示成功傳回網頁搜尋結果 (也就是至少包含一個網站的 Grounding 支援網址) 時，才會收取「Grounding with Google Search」和「Web Grounding for enterprise」的費用。另外收取 Gemini 模型使用費。
* Gemini 2.0 Flash Live API：每秒 25 個音訊 (輸入/輸出) 代幣，每秒 258 個影片 (輸入) 代幣。在 Gemini 2.0 Flash Live API 的預先發布期間，使用 Google 搜尋建立基準仍不需付費。

Vertex AI Model Optimizer 定價 (實驗性功能)*

Vertex AI 模型最佳化器為 Gemini 模型要求提供單一元資料端點，讓企業客戶更輕鬆地使用 Gemini，因為他們不必指定要使用 Flash、Pro 或特定版本。而是只需提供可設定的設定 (費用、品質或平衡) 來表示偏好，Model Optimizer 就會將每個查詢傳送至最合適的模型，以便根據工作套用適當的智慧程度。

Vertex AI 模型最佳化器會採用動態定價。也就是說，每個符碼的平均價格取決於用來完成工作模型的智慧程度。因此，我們在下方提供計費範例，根據您的設定說明可能發生的情況 (請參閱下方表格)。模型最佳化器 SKU 的價格為 $1 美元，可用於購買單位，用於計費。使用模型後，您仍會依用量計費。

5:1 輸入/輸出比	範例 1：聊天機器人	注意：這些範圍並非保證值，個別客戶的實際結果可能會有所不同
客戶偏好	已將客戶輸入的金鑰傳送給 MO	已將客戶輸出權杖傳送至 MO	每百萬單位代幣平均輸入價格 (高端)	每百萬個代幣的平均輸出價格 (高端)	每百萬個代幣的平均輸入價格 (低端)	每百萬單位代幣的平均輸出價格 (低端)
費用	10,000,000	2,000,000	$0.63 美元	$2.50 美元	$0.16 美元	$0.63 美元
平衡	10,000,000	2,000,000	$1.26 美元	$5.00 美元	$0.63 美元	$2.50 美元
品質	10,000,000	2,000,000	NT$567 元	$7.50	$1.26 美元	$5.00 美元

1:20 輸入輸出比	範例 2：內容生成
客戶偏好	已將客戶輸入的金鑰傳送給 MO	已將客戶輸出權杖傳送至 MO	每百萬單位代幣平均輸入價格 (高端)	每百萬個代幣的平均輸出價格 (高端)	每百萬個代幣的平均輸入價格 (低端)	每百萬單位代幣的平均輸出價格 (低端)
費用	1,000,000	20,000,000	$0.63 美元	$2.50 美元	$0.16 美元	$0.63 美元
平衡	1,000,000	20,000,000	$1.26 美元	$5.00 美元	$0.63 美元	$2.50 美元
品質	1,000,000	20,000,000	NT$567 元	$7.50	$1.26 美元	$5.00 美元

* Model Optimizer 是付費的實驗性產品，可能會將要求轉送至 Vertex 的 Gemini 實驗版。

其他 Gemini 機型

除了 Gemini 2.0 外，所有 Gemini 模型的計費方式都是根據字元、圖片、影片/音訊秒數等模式計算。文字輸入內容的計費單位為每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回應)。字元是以 UTF-8 碼點計算，空白字元則不列入計算，因此每個符記大約有 4 個字元。預測要求導致篩選回應時，只會收取輸入資料的費用。每個帳單週期結束時，小於一分美元的費用 ($0.01) 會四捨五入為一分美元。輸入媒體的費用是依圖片或影片的秒數計費。如果要求失敗並傳回 400 或 500 錯誤，您就不會因使用這些權杖而須付費。

模型	功能	類型	價格 ( =< 128K 個輸入符記)	價格： (超過 128,000 個輸入符記)
Gemini 1.5 Flash	多模態	圖片輸入影片輸入文字輸入音訊輸入	每張圖片 $0.00002 美元每秒$0.00002 美元每 1,000 個字元$0.00001875 美元每秒$0.000002 美元	每張圖片 $0.00004 美元每秒$0.00004 美元每 1,000 個字元$0.0000375 美元每秒$0.000004 美元
		文字輸出	每 1,000 個半形字元 $0.000075 美元	每 1,000 個字元 $0.00015 美元
	調整*	訓練權杖	$8 美元 / 百萬個代幣
Gemini 1.5 Pro	多模態	圖片輸入影片輸入文字輸入音訊輸入	每張圖片 $0.00032875 美元每秒$0.00032875 美元每 1,000 個字元$0.0003125 美元每秒$0.00003125 美元	每張圖片 $0.0006575 美元每秒$0.0006575 美元每 1,000 個字元$0.000625 美元每秒$0.0000625 美元
		文字輸出	每 1,000 個字元 $0.00125 美元	每 1,000 個字元 $0.0025 美元
	調整*	訓練權杖	$80 美元 / 百萬個符記
Gemini 1.0 Pro	多模態	圖片輸入影片輸入文字輸入	每張圖片 $0.0025 美元每秒$0.002 美元每 1,000 個字元$0.000125 美元
Gemini 1.0 Pro		文字輸出	每 1,000 個字元 $0.000375 美元
利用 Google 搜尋建立基準	文字	每 1,000 個 grounded 提示收費$35 美元。以事實為依據的提示是向 Gemini 提交的要求，用於向 Google 搜尋發出一或多個查詢*。即使向 Google 搜尋發送多個搜尋查詢，系統只會收取一次合理提示費用。如果您需要每天顯示超過 100 萬則實地導航提示，請與帳戶團隊聯絡。
企業適用的網站資料來源	文字	每 1,000 個 grounded 提示$45 美元。錨定提示是指向 Gemini 提交的要求，該要求會向 Web Grounding for enterprise* 發出一或多個查詢。即使向 Google 搜尋發送多個搜尋查詢，系統只會收取一次根據實際搜尋結果顯示提示的費用。如果您每天需要超過 100 萬個實地導航提示，請與帳戶團隊聯絡。
以資料為基準	文字	自 2025 年 6 月 16 日起，每 1,000 項要求的費用為 $2.5 美元。

* 價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* 如果查詢脈絡長度超過 128, 000 個詞元，所有詞元都會以長脈絡費率計費。
* 以批次模式使用 Gemini 模型可享 50% 折扣。
* Gemini 1.0 Pro 僅支援最多 32,000 個詞元的脈絡窗口。
* PDF 檔案會以圖片輸入形式計費，每個 PDF 頁面相當於一張圖片。
* 經調校的模型端點的預測價格與基本模型相同。
* 只有在提示成功傳回網頁搜尋結果 (也就是至少包含一個網站的 Grounding 支援網址) 時，才會收取「Grounding with Google Search」和「Web Grounding for enterprise」的費用。另外收取 Gemini 模型使用費。

Imagen

有了 Vertex AI 的 Imagen，您就能根據提供的文字提示生成新圖片及編輯圖片，或是使用您定義的遮罩區域，只編輯圖片的某些部分，並享有眾多其他功能。

型號	功能	說明	輸入內容	輸出內容	價格
圖片 4 Ultra	圖像生成	生成圖片	文字提示	圖片	每張圖片 $0.06 美元
圖 4	圖像生成	生成圖片	文字提示	圖片	每張圖片 $0.04 美元
圖片 4 快速版	圖像生成	生成圖片	文字提示	圖片	每張圖片 $0.02 美元
圖 3	圖像生成	生成圖片編輯圖片自訂圖片	文字提示	圖片	每張圖片 $0.04 美元
圖 3 快速版	圖像生成	生成圖片	文字提示	圖片	每張圖片 $0.02 美元
圖 2、圖	圖像生成	生成圖片	文字提示	圖片	每張 $0.020 美元
	圖像編輯	使用無遮罩或遮罩方式編輯圖片	圖像/文字提示	圖片	每張圖片 $0.020 美元
	提高解析度	將生成圖片的解析度提高至 2K 和 4K	圖片	圖片	每張圖片 $0.003 美元
	微調	啟用使用者提供的「主題」，用於 Imagen 提示 (少量樣本訓練)	主題(附文字識別碼) 和每個主題的 4 至 8 張圖片	微調模型 (使用者提供的主題訓練後)	每個節點小時的價格 (Vertex AI 自訂訓練價格)
	圖像說明生成	為圖片產生短文或長文說明	圖片	文字說明	每張圖片 $0.0015 美元
	圖像問題回答	根據提及圖片的問題提供解答	圖像/文字提示	文字答案	每張圖片 $0.0015 美元

價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。

Veo

Veo 2 能製作出極為優質的影片，無論是主題還是風格，都能呈現多樣化效果。這款工具的理解能力更強，可掌握真實物理效果，以及人體動作和表情的細微變化。

模型	功能	說明	輸入	輸出	費用
Veo 3	影片生成	根據文字提示或參考圖片生成影片	文字/圖片提示	影片	$0.50 美元/秒
Veo 3	影片 + 音訊生成	根據文字提示或參考圖片，生成同步語音/音效效果的影片	文字/圖片提示	影片 + 音訊	每秒 $0.75 美元
Veo 2	影片生成	根據文字提示或參考圖片生成影片	文字/圖片提示	影片	$0.50 美元/秒
Veo 2	進階控制項	透過起始和結束影格插值產生影片、延長產生的影片，並套用相機控制選項	文字/圖片/影片提示	影片	$0.50 美元/秒

Lyria

Lyria 2 可生成高品質的器樂音樂，非常適合用於精細的創作和細膩的創意探索，因為細微的輸出內容是關鍵。

模型	功能	說明	輸入	輸出	費用
Lyria 2	音樂生成	根據文字提示生成音樂	文字提示	音樂	每 30 秒 $0.06 美元

瞭解 AI 應用程式的嵌入成本

型號	類型	區域	每 1,000 個輸入代碼的價格
Gemini 嵌入	輸入	全球	線上要求：$0.00015 批次要求：$0.00012
Gemini 嵌入	輸出	全球	線上申請：免付費批次要求：不收費

型號	類型	區域	每 1,000 個字元的價格
文字嵌入 (不含 Gemini 文字嵌入)	輸入	全球	線上要求：$0.000025 批次要求：$0.00002
文字嵌入 (不含 Gemini 文字嵌入)	輸出	全球	線上申請：免付費批次要求：不收費

型號	功能	說明	輸入內容	輸出內容	價格
多模態嵌入	多模態專用嵌入：文字	以文字為輸入內容，產生嵌入	文字	嵌入	每 1,000 個輸入字元 $0.0002 美元
	適用於多模態的嵌入：圖像	以圖像為輸入內容，產生嵌入式表示	圖片	嵌入	每張圖片輸入 $0.0001 美元
	適用於多模態的嵌入：影片加	影片 Plus	影片	嵌入 (每分鐘影片最多 15 個嵌入)	每秒影片 $0.0020 美元
	多模態嵌入：影片標準	影片標準	影片	嵌入 (每分鐘影片最多 8 個嵌入)	每秒影片 $0.0010 美元
	多模態嵌入：影片基本要素	影片基本功能	影片	嵌入 (每分鐘影片最多可嵌入 4 個)	每秒影片 $0.0005 美元

價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。

Vertex AI 程式碼完成功能的定價

Vertex AI 的生成式 AI 服務是以每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回應) 為單位計費。字元數是以 UTF-8 的編碼點計算，空白字元則不列入計算。預先發布階段的費用可享 100% 折扣。預測要求若導致篩選回應，只會收取輸入費用。每個帳單週期結束時，系統會將小於一分美元的金額 (0.01 美元) 四捨五入為一分美元。

型號	類型	區域	每 1,000 個字元的價格
用於生成程式碼的 Codey	輸入	全球	線上要求：$0.00025
用於生成程式碼的 Codey	輸出	全球	線上要求：$0.0005 美元

價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。

翻譯 (文字)

使用 Vertex AI API 和 Translation LLM 翻譯文字。與傳統翻譯模型相比，大型語言模型翻譯的內容通常更流暢，聽起來也更像人類說話，但支援的語言較少 (瞭解詳情)。

模型	方法	用量	每 100 萬個字元價格
LLM	文字翻譯^*	每月輸入字元數	每 100 萬個字元 $10 美元^*
	文字翻譯^*	每月輸出字元數量	每 100 萬個字元 $10 美元^*

價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
^* 價格是以模型處理的每個字元計算，如要進一步瞭解如何計算字元數，請參閱計費字元

運用 Vertex AI 的內容快取功能，盡可能降低成本

有了情境快取功能，您就能將 Gemini 輸入符記處理成本降低 75%，並將內容產生延遲時間縮短。您只要將輸入文字或媒體的情境部分快取到 Gemini 模型，就能達成這項目標。資料在快取中儲存的時間長短 (可由使用者控制) 會決定「Context Cache Storage」的費用。建立快取內容時，使用者會被收取標準輸入權杖費用。輸入資料的快取命中會以較低的「快取輸入」費率計費，而非一般輸入費用。儲存空間和輸入資料的大小計算方式與 Gemini 輸入資料定價相同。

Gemini 2.5 模型

模型	功能	類型	價格 (每 100 萬個符記) <= 20 萬個輸入符記	價格 (每 100 萬個符記) > 20 萬個輸入符記
Gemini 2.5 Pro	快取輸入	輸入內容 (文字、圖片、影片、音訊)	$0.31 美元 (每 100 萬個符記)	$0.625 美元 (每 100 萬個代幣)
		輸出	不適用	不適用
	脈絡快取儲存空間	輸入內容 (文字、圖片、影片、音訊)	$4.5 美元 (每小時每位使用者)	$4.5 美元 (每小時每位使用者)
Gemini 2.5 Flash	快取輸入	輸入內容 (文字、圖片、影片、音訊)	$0.0375 美元 (每 100 萬個代幣)	$0.0375 美元 (每 100 萬個代幣)
		輸出	不適用	不適用
	脈絡快取儲存空間	輸入內容 (文字、圖片、影片、音訊)	$1 美元 (每 M 分鐘/小時)	$1 美元 (每 M 分鐘/小時)

Gemini 2.0 模型

以代幣為基礎的定價方式

模型	類型	儲存空間 (百萬度小時)	費用
Gemini 2.0 Flash
	100 萬個輸入內容詞元	$1.00 美元	$0.0375 美元
	100 萬個輸入音訊符記	$1.00 美元	$0.25 美元
	100 萬個輸出文字詞元	不適用	不適用
Gemini 2.0 Flash Lite
	100 萬個輸入內容詞元	$1.00 美元	$0.01875 美元
	100 萬個輸入音訊符記	$1.00 美元	$0.01875 美元
	100 萬個輸出文字詞元	不適用	不適用

以模式為基礎的定價

下列模式定價是根據平均用途計算而得，僅供參考。實際計費只會以代幣為準：

4 個字元會產生約 1 個文字符記 (含空格)。

1024x1024 圖片會消耗 1, 290 個記號。每個圖片的符記數量會因圖片解析度而異。如要進一步瞭解如何計算代幣，請參閱說明文件。

以每秒一張影格的取樣率計算，影片輸入每秒會消耗 258 個單位。影片和音訊帳單，分別列出影片和音訊代幣的使用量。

音訊輸入每秒會消耗 25 個單位，且不含時間戳記。

模型	類型	儲存空間 (模式-小時)	價格
Gemini 2.0 Flash
	輸入文字 ($/萬個字元)	$0.25 美元	$0.009375 美元
	輸入圖片 ($/圖片)	$0.00129 美元	$0.000048375 美元
	輸入影片 ($/秒)	$0.000258 美元	$0.000009675 美元
	輸入音訊 ($/秒)	$0.000025 美元	$0.00000625 美元
	輸出文字 ($/M 個字元)	不適用	不適用
Gemini 2.0 Flash Lite
	輸入文字 ($/萬個字元)	$0.25 美元	$0.0046875 美元
	輸入圖片 ($/圖片)	$0.00129 美元	$0.0000241875 美元
	輸入影片 ($/秒)	$0.000258 美元	$0.000009675 美元
	輸入音訊 ($/秒)	$0.000258 美元	$0.0000048375 美元
	輸出文字 ($/M 個字元)	不適用	不適用
利用 Google 搜尋建立基準	Gemini 2.0 Flash 每天提供最多 1,500 次實地查詢，不需額外付費。超過每日 1,500 次的 Grounded 要求將以每 1,000 次要求 $35 美元的價格計費 (每日最多 100 萬次要求)。如需每天超過 100 萬個要求，請與帳戶團隊聯絡。
企業適用的網站安全防護	自 2025 年 5 月 5 日起，每 1,000 項要求的費用為 $45 美元 (每日最多 100 萬項要求)。如需每天超過 100 萬個要求，請與帳戶團隊聯絡。

* 價格均以美元 (USD) 表示。如果您使用美元以外的貨幣付費，系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* PDF 檔案會以圖片輸入形式計費，每個 PDF 頁面相當於一張圖片。
* 經調校的模型端點的預測價格與基本模型相同。
* 只有當搜尋結果至少包含一個 Grounding with Google Search 支援網站的網址時，才會收取費用。同時也須支付標準的 Gemini 模型使用費。

佈建輸送量

已佈建的處理量可確保您能取得滿足生成式 AI 需求的處理量，並透過生成式 AI 擴充單元 (GSU) 進行交易。如要進一步瞭解每個 GSU 提供的處理量，請參閱這篇文章，並使用這項線上估算工具。

時間長度	每 GSU 的價格	每
1 週修訂版本	NT$36,000	週
1 個月的修訂版本	NT$81,000	月
3 個月的承諾	NT$72,000	月
承諾使用 1 年	$2,000 美元	月

費用計算範例

使用者必須確保每秒查詢次數 (QPS) 可達 10 次，且查詢輸入內容為 1,000 個文字符記和 500 個音訊符記，並透過 gemini-2.0-flash 接收 300 個文字符記的輸出內容。

參考效能和消耗率表格，我們知道 gemini-2.0-flash 的輸入文字代碼消耗率為 1 個代碼、輸入音訊代碼消耗率為 7 個代碼，輸出文字代碼消耗率為 4 個代碼。

使用者的輸入內容詞元總數為 1,000* (每個輸入文字內容詞元為 1 個) + 500* (每個輸入音訊內容詞元為 7 個) = 4,500 個調整後的輸入內容詞元。使用者的輸出詞元總數為 300* (每個輸出文字詞元 4 個詞元) = 1,200 個經調整的輸出詞元。加總後，我們得到的結果是：4,500 個經過消耗量調整的輸入權杖 + 1,200 個經過消耗量調整的輸出權杖 = 每項查詢共 5,700 個權杖。

將每項查詢的總記號數乘以每秒查詢次數，即可得出每秒總記號數：5,700 個 (每項查詢的總記號數) * 10 (每秒查詢次數) = 57,000 個。

將這個數字除以每個 GSU 每秒的總處理量，即可得出每秒總代碼數 ÷ 每個 GSU 每秒處理量 = 16.96 GSU。這個購買模式的 GSU 最小增量為 1，因此使用者需要 17 個 GSU。

如果使用者想在 1 週內維持這個處理量，每週的費用為 $1,200 * 17 GSU = $20,400 美元。如果他們想在 1 個月內維持這個處理量，每月費用為 $2,700 美元 * 17 個 GSU = $45,900 美元。如果他們想在 3 個月內維持這個處理量，每月費用為 $2,400 * 17 GSU = $40,800 美元。最後，如果他們想在 1 年內維持這個處理量，每月需要支付 $2,000 美元 * 17 個 GSU = $34,000 美元。

比較 Vertex AI 合作夥伴模型的定價

合作夥伴模型是 Google 合作夥伴開發的生成式 AI 模型精選清單。合作夥伴模型是以代管 API 的形式提供。詳情請參閱合作夥伴模式總覽。以下各節列出 Google 合作夥伴模式的定價詳細資料。

AI21 Labs 的模型

模型	定價
Jamba 1.5 大	輸入：每 100 萬個詞元 $2 美元輸出：每 100 萬個詞元 $8 美元
Jamba 1.5 Mini	輸入：每百萬個符號 $0.20 美元輸出：每百萬個符號 $0.40 美元

Anthropic 的 Claude 模型

模型	定價
Claude Opus 4	輸入：每百萬個符記 $15 美元輸出：每百萬個符記 $75 美元批次輸入：每百萬個符記 $7.5 美元批次輸出：每百萬個符記 $37.5 美元快取寫入：每百萬個符記 $18.75 美元快取命中：每百萬個符記 $1.5 美元批次快取寫入：每百萬個符記 $9.375 美元批次快取命中：每百萬個符記 $0.75 美元
Claude Sonnet 4	輸入：每百萬個符記 $3 美元輸出：每百萬個符記 $15 美元批次輸入：每百萬個符記 $1.5 美元批次輸出：每百萬個符記 $7.5 美元快取寫入：每百萬個符記 $3.75 美元快取命中：每百萬個符記 $0.30 美元批次快取寫入：每百萬個符記 $1.875 美元批次快取命中：每百萬個符記 $0.15 美元
Claude 3.7 Sonnet	輸入：每百萬個符記 $3 美元輸出：每百萬個符記 $15 美元批次輸入：每百萬個符記 $1.5 美元批次輸出：每百萬個符記 $7.5 美元快取寫入：每百萬個符記 $3.75 美元快取命中：每百萬個符記 $0.30 美元批次快取寫入：每百萬個符記 $1.875 美元批次快取命中：每百萬個符記 $0.15 美元
Claude 3.5 Haiku	輸入：每百萬個符記 $0.80 美元輸出：每百萬個符記 $4 美元批次輸入：每百萬個符記 $0.40 美元批次輸出：每百萬個符記 $2 美元快取寫入：每百萬個符記 $1 美元快取命中：每百萬個符記 $0.08 美元批次快取寫入：每百萬個符記 $0.50 美元批次快取命中：每百萬個符記 $0.04 美元
Claude 3.5 Sonnet v2	輸入：每百萬個符記 $3 美元輸出：每百萬個符記 $15 美元批次輸入：每百萬個符記 $1.5 美元批次輸出：每百萬個符記 $7.5 美元快取寫入：每百萬個符記 $3.75 美元快取命中：每百萬個符記 $0.30 美元批次快取寫入：每百萬個符記 $1.875 美元批次快取命中：每百萬個符記 $0.15 美元
Claude 3.5 Sonnet	輸入：每百萬個符記 $3 美元輸出：每百萬個符記 $15 美元快取寫入：每百萬個符記 $3.75 美元快取命中：每百萬個符記 $0.30 美元
Claude 3 Haiku	輸入：每百萬個符記 $0.25 美元輸出：每百萬個符記 $1.25 美元快取寫入：每百萬個符記 $0.30 美元快取命中：每百萬個符記 $0.03 美元
Claude 3 Sonnet (deprecated)	輸入：每百萬個詞元 $3 美元輸出：每百萬個詞元 $15 美元
Claude 3 Opus	輸入：每 100 萬個符號 $15 美元輸出：每 100 萬個符號 $75 美元快取寫入：每 100 萬個符號 $18.75 美元快取命中：每 100 萬個符號 $1.50 美元

Meta 的 Llama 模型

模型	定價
Llama 3.1 405B	輸入：每百萬個詞元 $5.00 美元輸出：每百萬個詞元 $16.00 美元
Llama 3.3 700 億 *	輸入：每百萬個符記 $0.72 美元輸出：每百萬個符記 $0.72 美元
Llama 4 Scout *	輸入：每百萬個符記 $0.25 美元輸出：每百萬個符記 $0.70 美元
小馬 4 馬維克 *	輸入：每百萬個字元 $0.35 美元輸出：每百萬個字元 $1.15 美元

2025 年 5 月 1 日前免費

Mistral AI 的模型

模型	定價
Mistral OCR (25.05)	輸入：每百萬個詞元 $0.0005 美元 (或每頁 $0.0005 美元) 輸出：每百萬個詞元 $0.0005 美元 (或每頁 $0.0005 美元)
Mistral Small 3.1 (25.03)	輸入：每百萬個詞元 $0.10 美元輸出：每百萬個詞元 $0.30 美元
Mistral Large (24.11)	輸入：每 100 萬個詞元 $2.00 美元輸出：每 100 萬個詞元 $6.00 美元
Mistral 尼莫	輸入：每百萬個符記 $0.15 美元輸出：每百萬個符記 $0.15 美元
Codestral (25.01)	輸入：每百萬個字元 $0.30 美元輸出：每百萬個字元 $0.90 美元

索取客製化報價

Google Cloud 提供「即付即用」計費模式，您只需要為所用服務付費。貴機構如需索取客製化的報價，請與我們的銷售團隊聯絡。

聯絡銷售人員