在 Vertex AI 中建構及部署 AI 模型的費用
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,則會按照 Cloud Platform SKU 頁面列出的相應貨幣價格計費。
您只需為傳回 200 回應代碼的要求付費。傳回 4xx 和 5xx 等其他回應代碼的要求,不會收取輸入或輸出費用。
本頁面說明 Vertex AI 的生成式 AI 定價。如要瞭解所有其他 Vertex AI 定價 (包括機器學習平台和機器學習運作服務),請參閱 Vertex AI 定價頁面。
Google 模型
Gemini 2.5
模型 | 類型 | 價格 (每 100 萬個符記) 不超過 20 萬個輸入符記 | 價格 (每 100 萬個符記) > 20 萬個輸入符記 | 價格 (每 100 萬個符記) <= 20 萬個符記,使用批次 API 輸入 | 價格 (每 100 萬個符記) > 20 萬個輸入符記,使用批次 API |
---|---|---|---|---|---|
Gemini 2.5 Pro | |||||
輸入內容 (文字、圖片、影片、音訊) | $1.25 美元 | $2.5 美元 | $0.625 美元 | $1.25 美元 | |
文字輸出內容 (回應和推論) | $10 美元 | $15 | $5 美元 | $7.5 | |
Gemini 2.5 正式發布版 Flash |
|||||
輸入內容 (文字、圖片、影片) | $0.30 美元 | $0.30 美元 | $0.15 美元 | $0.15 美元 | |
音訊輸入 | $1 美元 | $1 美元 | $0.5 | $0.5 | |
文字輸出 | $2.50 美元 | $2.50 美元 | $1.25 美元 | $1.25 美元 | |
為 100 萬個訓練符記調整 | $5.00 美元 | 不適用 | 不適用 | 不適用 | |
Gemini 2.5 Flash 預先發布版 (端點已於 2025 年 7 月 15 日淘汰) |
|||||
輸入內容 (文字、圖片、影片) | $0.15 美元 | $0.15 美元 | $0.075 美元 | $0.075 美元 | |
音訊輸入 | $1 美元 | $1 美元 | $0.5 | $0.5 | |
文字輸出內容 (不需思考) | $0.60 美元 | $0.60 美元 | $0.30 美元 | $0.30 美元 | |
文字輸出 (思考、回應和推理) | $3.50 美元 | $3.50 美元 | $1.75 | $1.75 | |
Gemini 2.5 Flash Live API |
|||||
100 萬個輸入文字符記 | $0.5 | $0.5 | 不適用 | 不適用 | |
100 萬個輸入音訊符記 | $3 美元 | $3 美元 | 不適用 | 不適用 | |
100 萬個輸入影片詞元 | $3 美元 | $3 美元 | 不適用 | 不適用 | |
100 萬個輸出文字詞元 | $2 美元 | $2 美元 | 不適用 | 不適用 | |
100 萬個輸出音訊詞元 | $12 美元 | $12 美元 | 不適用 | 不適用 | |
Gemini 2.5 Flash Lite |
|||||
輸入內容 (文字、圖片、影片) | $0.1 美元 | $0.1 美元 | 不適用 | 不適用 | |
音訊輸入 | $0.5 | $0.5 | 不適用 | 不適用 | |
文字輸出內容 (回應和推論) | $0.4 美元 | $0.4 美元 | 不適用 | 不適用 | |
利用 Google 搜尋建立基準 |
Gemini 2.0 Flash、2.5 Flash 和 2.5 Flash-Lite 每天提供 1,500 則實地提示,不需額外付費。Gemini 2.5 Pro 提供每日 10,000 則心平靜和提示,不需額外付費。 超過上述限制的實地考察提示將按 每 1,000 個實地考察提示$35 美元計費。 「具體提示」是指向 Gemini 提交的請求,會向 Google 搜尋發出一或多個查詢**。即使向 Google 搜尋發送多個搜尋查詢,系統只會收取一次合理提示費用。 如需每天超過 100 萬個實地導航提示,請與帳戶團隊聯絡。 |
||||
企業適用的網站安全防護 |
每 1,000 個 grounded 提示$45 美元。錨定提示是指向 Gemini 提交的要求,該要求會向企業版 Web Grounding 發出一或多項查詢**。即使向 Google 搜尋發送多個搜尋查詢,系統只會收取一次合理提示費用。 如需每天超過 100 萬個實地導航提示,請與帳戶團隊聯絡。 |
||||
以資料為基準 | 2025 年 6 月 16 日起,每 1,000 次要求費用為 $2.5 美元。 |
* 如果查詢輸入內容超過 20 萬個符記,系統會以長文本情境費率收費,計算所有輸入和輸出符記。
** 只有在提示成功傳回網頁結果 (也就是結果中至少包含一個來自網頁的 Grounding 支援網址) 時,才會收取「Grounding with Google Search」和「Web Grounding for enterprise」的費用。另外收取 Gemini 模型使用費。
Gemini 2.0
Gemini 2.0 的計費方式是依據「單位」計算。如要在傳送要求前計算要求中的輸入詞元數,可以使用 SDK 分詞器或 countTokens API。如果要求失敗並傳回 400 或 500 錯誤,您就不會因使用這些權杖而須付費。
使用價目表中的切換按鈕,比較以代碼為基礎和以模式為基礎的定價。
以代幣為基礎的定價方式
模型 | 類型 | 費用 | 使用 Batch API 定價 |
---|---|---|---|
Gemini 2.0 Flash |
|||
100 萬個輸入內容詞元 | $0.15 美元 | $0.075 美元 | |
100 萬個輸入音訊符記 | $1.00 美元 | $0.50 美元 | |
100 萬個輸出文字詞元 | $0.60 美元 | $0.30 美元 | |
為 100 萬個訓練符記調整 | $3.00 美元 | ||
Gemini 2.0 Flash 圖片產生功能 |
|||
100 萬個輸入內容詞元 | $0.15 美元 | ||
100 萬個輸入音訊符記 | $1.00 美元 | ||
100 萬個輸入影片詞元 | $3 美元 | ||
100 萬個輸出文字詞元 | $0.60 美元 | ||
100 萬個輸出圖像詞元 | $30.00 | ||
Gemini 2.0 Flash Live API |
|||
100 萬個輸入文字符記 | $0.5 | ||
100 萬個輸入音訊符記 | $3 美元 | ||
100 萬個輸入影片詞元 | $3 美元 | ||
100 萬個輸出文字詞元 | $2 美元 | ||
100 萬個輸出音訊詞元 | $12 美元 | ||
Gemini 2.0 Flash Lite |
|||
100 萬個輸入內容詞元 | $0.075 美元 | $0.0375 美元 | |
100 萬個輸入音訊符記 | $0.075 美元 | $0.0375 美元 | |
100 萬個輸出文字詞元 | $0.30 美元 | $0.15 美元 | |
為 100 萬個訓練符記調整 | $1.00 美元 | ||
利用 Google 搜尋建立基準 |
Gemini 2.0 Flash 和 2.5 Flash 每天提供 1,500 則放鬆提示,不需額外付費。 超過上述限制的實地調查提示將按 每 1,000 個實地調查提示$35 美元計費。 以事實為依據的提示是指向 Gemini 提交的要求,該要求會向 Google 搜尋發出一或多個查詢*。即使向 Google 搜尋發送多個搜尋查詢,系統只會收取一次合理提示費用。 如需每天超過 100 萬則實地導航提示,請與帳戶團隊聯絡。 |
||
企業適用的網站安全防護 |
每 1,000 個 grounded 提示$45 美元。錨定提示是指向 Gemini 提交的要求,該要求會向 Web Grounding for enterprise* 發出一或多項查詢。即使向 Google 搜尋發送多個搜尋查詢,系統只會收取一次合理提示費用。 如需每天超過 100 萬則實地導航提示,請與帳戶團隊聯絡。 |
||
以資料為基準 | 2025 年 6 月 16 日起,每 1,000 次要求費用為 $2.5 美元。 |
以模式為基礎的定價
下列模式定價是根據平均用途計算而得,僅供參考。實際計費只會以代幣為準:
- 4 個字元會產生約 1 個文字符記 (含空格)。
- 1024x1024 圖片會消耗 1, 290 個記號。每個圖片的符記數量會因圖片解析度而異。如要進一步瞭解如何計算代幣,請參閱說明文件。
- 以每秒一張影格的取樣率計算,影片輸入每秒會消耗 258 個單位。影片和音訊帳單,分別列出影片和音訊代幣的使用量。
- 音訊輸入每秒會消耗 25 個權杖,且不含時間戳記。
模型 | 類型 | 費用 | 使用 Batch API 定價 |
---|---|---|---|
Gemini 2.0 Flash |
|||
輸入文字 ($/萬個字元) | $0.0375 美元 | $0.01875 美元 | |
輸入圖片 ($/圖片) | $0.0001935 美元 | $0.00009675 美元 | |
輸入影片 ($/秒) | $0.0000387 美元 | $0.00001935 美元 | |
輸入音訊 ($/秒) | $0.000025 美元 | $0.0000125 美元 | |
輸出文字 ($/M 個字元) | $0.15 美元 | $0.075 美元 | |
Gemini 2.0 Flash 圖片產生功能 |
|||
輸入文字 ($/萬個字元) | $0.0375 美元 | ||
輸入圖片 ($/圖片) | $0.0001935 美元 | ||
輸入影片 ($/秒) | $0.0000387 美元 | ||
輸入音訊 ($/秒) | $0.000025 美元 | ||
輸出文字 ($/M 個字元) | $0.15 美元 | ||
輸出圖片 (每張圖片費用) | $0.04 美元 | ||
Gemini 2.0 Flash Lite |
|||
輸入文字 ($/萬個字元) | $0.01875 美元 | $0.009375 美元 | |
輸入圖片 ($/圖片) | $0.00009675 美元 | $0.000048375 美元 | |
輸入影片 ($/秒) | $0.00001935 美元 | $0.000009675 美元 | |
輸入音訊 ($/秒) | $0.000001875 美元 | $0.000000938 美元 | |
輸出文字 ($/M 個字元) | $0.075 美元 | $0.0375 美元 | |
利用 Google 搜尋建立基準 |
Gemini 2.0 Flash 和 2.5 Flash 每天提供 1,500 則放鬆提示,不需額外付費。 超過上述限制的實地調查提示將按 每 1,000 個實地調查提示$35 美元計費。 以事實為依據的提示是指向 Gemini 提交的要求,該要求會向 Google 搜尋發出一或多個查詢*。即使向 Google 搜尋發送多個搜尋查詢,系統只會收取一次合理提示費用。 如需每天超過 100 萬則實地導航提示,請與帳戶團隊聯絡。 |
||
企業適用的網站安全防護 |
每 1,000 個 grounded 提示$45 美元。錨定提示是指向 Gemini 提交的要求,該要求會向 Web Grounding for enterprise* 發出一或多項查詢。即使向 Google 搜尋發送多個搜尋查詢,系統只會收取一次合理提示費用。 如需每天超過 100 萬則實地導航提示,請與帳戶團隊聯絡。 |
* 價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* 訓練詞元的計算方式是將訓練資料集中的詞元總數乘以訓練週期數。
* PDF 檔案會以圖片輸入形式計費,每個 PDF 頁面相當於一張圖片。
* 經調校的模型端點的預測價格與基本模型相同。
* 只有當提示成功傳回網頁搜尋結果 (也就是至少包含一個網站的 Grounding 支援網址) 時,才會收取「Grounding with Google Search」和「Web Grounding for enterprise」的費用。另外收取 Gemini 模型使用費。
* Gemini 2.0 Flash Live API:每秒 25 個音訊 (輸入/輸出) 代幣,每秒 258 個影片 (輸入) 代幣。在 Gemini 2.0 Flash Live API 的預先發布期間,使用 Google 搜尋建立基準仍不需付費。
Vertex AI Model Optimizer 定價 (實驗性功能)*
Vertex AI 模型最佳化器為 Gemini 模型要求提供單一元資料端點,讓企業客戶更輕鬆地使用 Gemini,因為他們不必指定要使用 Flash、Pro 或特定版本。而是只需提供可設定的設定 (費用、品質或平衡) 來表示偏好,Model Optimizer 就會將每個查詢傳送至最合適的模型,以便根據工作套用適當的智慧程度。
Vertex AI 模型最佳化器會採用動態定價。也就是說,每個符碼的平均價格取決於用來完成工作模型的智慧程度。因此,我們在下方提供計費範例,根據您的設定說明可能發生的情況 (請參閱下方表格)。模型最佳化器 SKU 的價格為 $1 美元,可用於購買單位,用於計費。使用模型後,您仍會依用量計費。
5:1 輸入/輸出比 | 範例 1: 聊天機器人 |
注意:這些範圍並非保證值,個別客戶的實際結果可能會有所不同 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
客戶偏好 | 已將客戶輸入的金鑰傳送給 MO | 已將客戶輸出權杖傳送至 MO | 每百萬單位代幣平均輸入價格 (高端) | 每百萬個代幣的平均輸出價格 (高端) | 每百萬個代幣的平均輸入價格 (低端) | 每百萬單位代幣的平均輸出價格 (低端) | |||||
費用 | 10,000,000 | 2,000,000 | $0.63 美元 | $2.50 美元 | $0.16 美元 | $0.63 美元 | |||||
平衡 | 10,000,000 | 2,000,000 | $1.26 美元 | $5.00 美元 | $0.63 美元 | $2.50 美元 | |||||
品質 | 10,000,000 | 2,000,000 | NT$567 元 | $7.50 | $1.26 美元 | $5.00 美元 |
1:20 輸入輸出比 | 範例 2:內容生成 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
客戶偏好 | 已將客戶輸入的金鑰傳送給 MO | 已將客戶輸出權杖傳送至 MO | 每百萬單位代幣平均輸入價格 (高端) | 每百萬個代幣的平均輸出價格 (高端) | 每百萬個代幣的平均輸入價格 (低端) | 每百萬單位代幣的平均輸出價格 (低端) | |||||
費用 | 1,000,000 | 20,000,000 | $0.63 美元 | $2.50 美元 | $0.16 美元 | $0.63 美元 | |||||
平衡 | 1,000,000 | 20,000,000 | $1.26 美元 | $5.00 美元 | $0.63 美元 | $2.50 美元 | |||||
品質 | 1,000,000 | 20,000,000 | NT$567 元 | $7.50 | $1.26 美元 | $5.00 美元 |
其他 Gemini 機型
除了 Gemini 2.0 外,所有 Gemini 模型的計費方式都是根據字元、圖片、影片/音訊秒數等模式計算。文字輸入內容的計費單位為每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回應)。字元是以 UTF-8 碼點計算,空白字元則不列入計算,因此每個符記大約有 4 個字元。預測要求導致篩選回應時,只會收取輸入資料的費用。每個帳單週期結束時,小於一分美元的費用 ($0.01) 會四捨五入為一分美元。輸入媒體的費用是依圖片或影片的秒數計費。如果要求失敗並傳回 400 或 500 錯誤,您就不會因使用這些權杖而須付費。
模型 | 功能 | 類型 | 價格 ( =< 128K 個輸入符記) |
價格: (超過 128,000 個輸入符記) |
||
---|---|---|---|---|---|---|
Gemini 1.5 Flash | 多模態 | 圖片輸入 影片輸入 文字輸入 音訊輸入 |
每張圖片 $0.00002 美元 每秒$0.00002 美元 每 1,000 個字元$0.00001875 美元 每秒$0.000002 美元 |
每張圖片 $0.00004 美元 每秒$0.00004 美元 每 1,000 個字元$0.0000375 美元 每秒$0.000004 美元 |
||
文字輸出 | 每 1,000 個半形字元 $0.000075 美元 | 每 1,000 個字元 $0.00015 美元 | ||||
調整* | 訓練權杖 | $8 美元 / 百萬個代幣 | ||||
Gemini 1.5 Pro | 多模態 | 圖片輸入 影片輸入 文字輸入 音訊輸入 |
每張圖片 $0.00032875 美元 每秒$0.00032875 美元 每 1,000 個字元$0.0003125 美元 每秒$0.00003125 美元 |
每張圖片 $0.0006575 美元 每秒$0.0006575 美元 每 1,000 個字元$0.000625 美元 每秒$0.0000625 美元 |
||
文字輸出 | 每 1,000 個字元 $0.00125 美元 | 每 1,000 個字元 $0.0025 美元 | ||||
調整* | 訓練權杖 | $80 美元 / 百萬個符記 | ||||
Gemini 1.0 Pro | 多模態 | 圖片輸入 影片輸入 文字輸入 |
每張圖片 $0.0025 美元 每秒$0.002 美元 每 1,000 個字元$0.000125 美元 |
|||
文字輸出 | 每 1,000 個字元 $0.000375 美元 | |||||
利用 Google 搜尋建立基準 | 文字 | 每 1,000 個 grounded 提示收費$35 美元。 以事實為依據的提示是向 Gemini 提交的要求,用於向 Google 搜尋發出一或多個查詢*。即使向 Google 搜尋發送多個搜尋查詢,系統只會收取一次合理提示費用。 如果您需要每天顯示超過 100 萬則實地導航提示,請與帳戶團隊聯絡。 |
||||
企業適用的網站資料來源 | 文字 | 每 1,000 個 grounded 提示$45 美元。 錨定提示是指向 Gemini 提交的要求,該要求會向 Web Grounding for enterprise* 發出一或多個查詢。即使向 Google 搜尋發送多個搜尋查詢,系統只會收取一次根據實際搜尋結果顯示提示的費用。 如果您每天需要超過 100 萬個實地導航提示,請與帳戶團隊聯絡。 |
||||
以資料為基準 | 文字 | 自 2025 年 6 月 16 日起,每 1,000 項要求的費用為 $2.5 美元。 |
* 價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* 如果查詢脈絡長度超過 128, 000 個詞元,所有詞元都會以長脈絡費率計費。
* 以批次模式使用 Gemini 模型可享 50% 折扣。
* Gemini 1.0 Pro 僅支援最多 32,000 個詞元的脈絡窗口。
* PDF 檔案會以圖片輸入形式計費,每個 PDF 頁面相當於一張圖片。
* 經調校的模型端點的預測價格與基本模型相同。
* 只有在提示成功傳回網頁搜尋結果 (也就是至少包含一個網站的 Grounding 支援網址) 時,才會收取「Grounding with Google Search」和「Web Grounding for enterprise」的費用。另外收取 Gemini 模型使用費。
Imagen
有了 Vertex AI 的 Imagen,您就能根據提供的文字提示生成新圖片及編輯圖片,或是使用您定義的遮罩區域,只編輯圖片的某些部分,並享有眾多其他功能。
型號 | 功能 | 說明 | 輸入內容 | 輸出內容 | 價格 |
---|---|---|---|---|---|
圖片 4 Ultra | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張圖片 $0.06 美元 |
圖 4 | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張圖片 $0.04 美元 |
圖片 4 快速版 | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張圖片 $0.02 美元 |
圖 3 | 圖像生成 | 生成圖片 編輯圖片 自訂圖片 |
文字提示 | 圖片 | 每張圖片 $0.04 美元 |
圖 3 快速版 | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張圖片 $0.02 美元 |
圖 2、圖 | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張 $0.020 美元 |
圖像編輯 | 使用無遮罩或遮罩方式編輯圖片 | 圖像/文字提示 | 圖片 | 每張圖片 $0.020 美元 | |
提高解析度 | 將生成圖片的解析度提高至 2K 和 4K | 圖片 | 圖片 | 每張圖片 $0.003 美元 | |
微調 | 啟用使用者提供的「主題」,用於 Imagen 提示 (少量樣本訓練) | 主題(附文字識別碼) 和每個主題的 4 至 8 張圖片 | 微調模型 (使用者提供的主題訓練後) | 每個節點小時的價格 (Vertex AI 自訂訓練價格) | |
圖像說明生成 | 為圖片產生短文或長文說明 | 圖片 | 文字說明 | 每張圖片 $0.0015 美元 | |
圖像問題回答 | 根據提及圖片的問題提供解答 | 圖像/文字提示 | 文字答案 | 每張圖片 $0.0015 美元 |
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
Veo
Veo 2 能製作出極為優質的影片,無論是主題還是風格,都能呈現多樣化效果。這款工具的理解能力更強,可掌握真實物理效果,以及人體動作和表情的細微變化。
模型 | 功能 | 說明 | 輸入 | 輸出 | 費用 |
---|---|---|---|---|---|
Veo 3 | 影片生成 | 根據文字提示或參考圖片生成影片 | 文字/圖片提示 | 影片 | $0.50 美元/秒 |
Veo 3 | 影片 + 音訊生成 | 根據文字提示或參考圖片,生成同步語音/音效效果的影片 | 文字/圖片提示 | 影片 + 音訊 | 每秒 $0.75 美元 |
Veo 2 | 影片生成 | 根據文字提示或參考圖片生成影片 | 文字/圖片提示 | 影片 | $0.50 美元/秒 |
Veo 2 | 進階控制項 | 透過起始和結束影格插值產生影片、延長產生的影片,並套用相機控制選項 | 文字/圖片/影片提示 | 影片 | $0.50 美元/秒 |
Lyria
Lyria 2 可生成高品質的器樂音樂,非常適合用於精細的創作和細膩的創意探索,因為細微的輸出內容是關鍵。
模型 | 功能 | 說明 | 輸入 | 輸出 | 費用 |
---|---|---|---|---|---|
Lyria 2 | 音樂生成 | 根據文字提示生成音樂 | 文字提示 | 音樂 | 每 30 秒 $0.06 美元 |
瞭解 AI 應用程式的嵌入成本
型號 | 類型 | 區域 | 每 1,000 個輸入代碼的價格 |
---|---|---|---|
Gemini 嵌入 | 輸入 | 全球 |
|
輸出 | 全球 |
|
型號 | 類型 | 區域 | 每 1,000 個字元的價格 |
---|---|---|---|
文字嵌入 (不含 Gemini 文字嵌入) |
輸入 | 全球 |
|
輸出 | 全球 |
|
型號 | 功能 | 說明 | 輸入內容 | 輸出內容 | 價格 |
---|---|---|---|---|---|
多模態嵌入 | 多模態專用嵌入:文字 | 以文字為輸入內容,產生嵌入 | 文字 | 嵌入 | 每 1,000 個輸入字元 $0.0002 美元 |
適用於多模態的嵌入:圖像 | 以圖像為輸入內容,產生嵌入式表示 | 圖片 | 嵌入 | 每張圖片輸入 $0.0001 美元 | |
適用於多模態的嵌入:影片加 | 影片 Plus | 影片 | 嵌入 (每分鐘影片最多 15 個嵌入) | 每秒影片 $0.0020 美元 | |
多模態嵌入:影片標準 | 影片標準 | 影片 | 嵌入 (每分鐘影片最多 8 個嵌入) | 每秒影片 $0.0010 美元 | |
多模態嵌入:影片基本要素 | 影片基本功能 | 影片 | 嵌入 (每分鐘影片最多可嵌入 4 個) | 每秒影片 $0.0005 美元 |
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
Vertex AI 程式碼完成功能的定價
Vertex AI 的生成式 AI 服務是以每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回應) 為單位計費。字元數是以 UTF-8 的編碼點計算,空白字元則不列入計算。預先發布階段的費用可享 100% 折扣。預測要求若導致篩選回應,只會收取輸入費用。每個帳單週期結束時,系統會將小於一分美元的金額 (0.01 美元) 四捨五入為一分美元。
型號 | 類型 | 區域 | 每 1,000 個字元的價格 |
---|---|---|---|
用於生成程式碼的 Codey | 輸入 | 全球 |
|
輸出 | 全球 |
|
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
翻譯 (文字)
使用 Vertex AI API 和 Translation LLM 翻譯文字。與傳統翻譯模型相比,大型語言模型翻譯的內容通常更流暢,聽起來也更像人類說話,但支援的語言較少 (瞭解詳情)。
模型 | 方法 | 用量 | 每 100 萬個字元價格 |
---|---|---|---|
LLM | 文字翻譯* | 每月輸入字元數 |
每 100 萬個字元 $10 美元* |
每月輸出字元數量 |
每 100 萬個字元 $10 美元* |
價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* 價格是以模型處理的每個字元計算,如要進一步瞭解如何計算字元數,請參閱計費字元
運用 Vertex AI 的內容快取功能,盡可能降低成本
有了情境快取功能,您就能將 Gemini 輸入符記處理成本降低 75%,並將內容產生延遲時間縮短。您只要將輸入文字或媒體的情境部分快取到 Gemini 模型,就能達成這項目標。資料在快取中儲存的時間長短 (可由使用者控制) 會決定「Context Cache Storage」的費用。建立快取內容時,使用者會被收取標準輸入權杖費用。輸入資料的快取命中會以較低的「快取輸入」費率計費,而非一般輸入費用。儲存空間和輸入資料的大小計算方式與 Gemini 輸入資料定價相同。
Gemini 2.5 模型
模型 | 功能 | 類型 | 價格 (每 100 萬個符記) <= 20 萬個輸入符記 |
價格 (每 100 萬個符記) > 20 萬個輸入符記 |
---|---|---|---|---|
Gemini 2.5 Pro | 快取輸入 | 輸入內容 (文字、圖片、影片、音訊) | $0.31 美元 (每 100 萬個符記) | $0.625 美元 (每 100 萬個代幣) |
輸出 | 不適用 | 不適用 | ||
脈絡快取儲存空間 | 輸入內容 (文字、圖片、影片、音訊) | $4.5 美元 (每小時每位使用者) | $4.5 美元 (每小時每位使用者) | |
Gemini 2.5 Flash | 快取輸入 | 輸入內容 (文字、圖片、影片、音訊) | $0.0375 美元 (每 100 萬個代幣) | $0.0375 美元 (每 100 萬個代幣) |
輸出 | 不適用 | 不適用 | ||
脈絡快取儲存空間 | 輸入內容 (文字、圖片、影片、音訊) | $1 美元 (每 M 分鐘/小時) | $1 美元 (每 M 分鐘/小時) |
Gemini 2.0 模型
以代幣為基礎的定價方式
模型 |
類型 |
儲存空間 (百萬度小時) |
費用 |
---|---|---|---|
Gemini 2.0 Flash |
|||
100 萬個輸入內容詞元 | $1.00 美元 | $0.0375 美元 | |
100 萬個輸入音訊符記 | $1.00 美元 | $0.25 美元 | |
100 萬個輸出文字詞元 | 不適用 | 不適用 | |
Gemini 2.0 Flash Lite |
|||
100 萬個輸入內容詞元 | $1.00 美元 | $0.01875 美元 | |
100 萬個輸入音訊符記 | $1.00 美元 | $0.01875 美元 | |
100 萬個輸出文字詞元 | 不適用 | 不適用 |
以模式為基礎的定價
下列模式定價是根據平均用途計算而得,僅供參考。實際計費只會以代幣為準:
- 4 個字元會產生約 1 個文字符記 (含空格)。
- 1024x1024 圖片會消耗 1, 290 個記號。每個圖片的符記數量會因圖片解析度而異。如要進一步瞭解如何計算代幣,請參閱說明文件。
- 以每秒一張影格的取樣率計算,影片輸入每秒會消耗 258 個單位。影片和音訊帳單,分別列出影片和音訊代幣的使用量。
- 音訊輸入每秒會消耗 25 個單位,且不含時間戳記。
模型 |
類型 |
儲存空間 (模式-小時) |
價格 |
---|---|---|---|
Gemini 2.0 Flash |
|||
輸入文字 ($/萬個字元) | $0.25 美元 | $0.009375 美元 | |
輸入圖片 ($/圖片) | $0.00129 美元 | $0.000048375 美元 | |
輸入影片 ($/秒) | $0.000258 美元 | $0.000009675 美元 | |
輸入音訊 ($/秒) | $0.000025 美元 | $0.00000625 美元 | |
輸出文字 ($/M 個字元) | 不適用 | 不適用 | |
Gemini 2.0 Flash Lite |
|||
輸入文字 ($/萬個字元) | $0.25 美元 | $0.0046875 美元 | |
輸入圖片 ($/圖片) | $0.00129 美元 | $0.0000241875 美元 | |
輸入影片 ($/秒) | $0.000258 美元 | $0.000009675 美元 | |
輸入音訊 ($/秒) | $0.000258 美元 | $0.0000048375 美元 | |
輸出文字 ($/M 個字元) | 不適用 | 不適用 | |
利用 Google 搜尋建立基準 |
Gemini 2.0 Flash 每天提供最多 1,500 次實地查詢,不需額外付費。超過每日 1,500 次的 Grounded 要求 將以每 1,000 次要求 $35 美元的價格計費 (每日最多 100 萬次要求)。 如需每天超過 100 萬個要求,請與帳戶團隊聯絡。 |
||
企業適用的網站安全防護 |
自 2025 年 5 月 5 日起,每 1,000 項要求的費用為 $45 美元 (每日最多 100 萬項要求)。 如需每天超過 100 萬個要求,請與帳戶團隊聯絡。 |
* 價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* PDF 檔案會以圖片輸入形式計費,每個 PDF 頁面相當於一張圖片。
* 經調校的模型端點的預測價格與基本模型相同。
* 只有當搜尋結果至少包含一個 Grounding with Google Search 支援網站的網址時,才會收取費用。同時也須支付標準的 Gemini 模型使用費。
佈建輸送量
已佈建的處理量可確保您能取得滿足生成式 AI 需求的處理量,並透過 生成式 AI 擴充單元 (GSU) 進行交易。如要進一步瞭解每個 GSU 提供的處理量,請參閱這篇文章,並使用這項線上估算工具。
時間長度 | 每 GSU 的價格 | 每 |
---|---|---|
1 週修訂版本 | NT$36,000 | 週 |
1 個月的修訂版本 | NT$81,000 | 月 |
3 個月的承諾 | NT$72,000 | 月 |
承諾使用 1 年 | $2,000 美元 | 月 |
費用計算範例
使用者必須確保每秒查詢次數 (QPS) 可達 10 次,且查詢輸入內容為 1,000 個文字符記和 500 個音訊符記,並透過 gemini-2.0-flash 接收 300 個文字符記的輸出內容。
參考效能和消耗率表格,我們知道 gemini-2.0-flash 的輸入文字代碼消耗率為 1 個代碼、輸入音訊代碼消耗率為 7 個代碼,輸出文字代碼消耗率為 4 個代碼。
使用者的輸入內容詞元總數為 1,000* (每個輸入文字內容詞元為 1 個) + 500* (每個輸入音訊內容詞元為 7 個) = 4,500 個調整後的輸入內容詞元。使用者的輸出詞元總數為 300* (每個輸出文字詞元 4 個詞元) = 1,200 個經調整的輸出詞元。加總後,我們得到的結果是:4,500 個經過消耗量調整的輸入權杖 + 1,200 個經過消耗量調整的輸出權杖 = 每項查詢共 5,700 個權杖。
將每項查詢的總記號數乘以每秒查詢次數,即可得出每秒總記號數:5,700 個 (每項查詢的總記號數) * 10 (每秒查詢次數) = 57,000 個。
將這個數字除以每個 GSU 每秒的總處理量,即可得出每秒總代碼數 ÷ 每個 GSU 每秒處理量 = 16.96 GSU。這個購買模式的 GSU 最小增量為 1,因此使用者需要 17 個 GSU。
如果使用者想在 1 週內維持這個處理量,每週的費用為 $1,200 * 17 GSU = $20,400 美元。如果他們想在 1 個月內維持這個處理量,每月費用為 $2,700 美元 * 17 個 GSU = $45,900 美元。如果他們想在 3 個月內維持這個處理量,每月費用為 $2,400 * 17 GSU = $40,800 美元。最後,如果他們想在 1 年內維持這個處理量,每月需要支付 $2,000 美元 * 17 個 GSU = $34,000 美元。
比較 Vertex AI 合作夥伴模型的定價
合作夥伴模型是 Google 合作夥伴開發的生成式 AI 模型精選清單。合作夥伴模型是以代管 API 的形式提供。詳情請參閱合作夥伴模式總覽。以下各節列出 Google 合作夥伴模式的定價詳細資料。
AI21 Labs 的模型
模型 | 定價 |
---|---|
Jamba 1.5 大 | 輸入:每 100 萬個詞元 $2 美元 輸出:每 100 萬個詞元 $8 美元 |
Jamba 1.5 Mini | 輸入:每百萬個符號 $0.20 美元 輸出:每百萬個符號 $0.40 美元 |
Anthropic 的 Claude 模型
模型 | 定價 |
---|---|
Claude Opus 4 | 輸入:每百萬個符記 $15 美元 輸出:每百萬個符記 $75 美元 批次輸入:每百萬個符記 $7.5 美元 批次輸出:每百萬個符記 $37.5 美元 快取寫入:每百萬個符記 $18.75 美元 快取命中:每百萬個符記 $1.5 美元 批次快取寫入:每百萬個符記 $9.375 美元 批次快取命中:每百萬個符記 $0.75 美元 |
Claude Sonnet 4 | 輸入:每百萬個符記 $3 美元 輸出:每百萬個符記 $15 美元 批次輸入:每百萬個符記 $1.5 美元 批次輸出:每百萬個符記 $7.5 美元 快取寫入:每百萬個符記 $3.75 美元 快取命中:每百萬個符記 $0.30 美元 批次快取寫入:每百萬個符記 $1.875 美元 批次快取命中:每百萬個符記 $0.15 美元 |
Claude 3.7 Sonnet | 輸入:每百萬個符記 $3 美元 輸出:每百萬個符記 $15 美元 批次輸入:每百萬個符記 $1.5 美元 批次輸出:每百萬個符記 $7.5 美元 快取寫入:每百萬個符記 $3.75 美元 快取命中:每百萬個符記 $0.30 美元 批次快取寫入:每百萬個符記 $1.875 美元 批次快取命中:每百萬個符記 $0.15 美元 |
Claude 3.5 Haiku | 輸入:每百萬個符記 $0.80 美元 輸出:每百萬個符記 $4 美元 批次輸入:每百萬個符記 $0.40 美元 批次輸出:每百萬個符記 $2 美元 快取寫入:每百萬個符記 $1 美元 快取命中:每百萬個符記 $0.08 美元 批次快取寫入:每百萬個符記 $0.50 美元 批次快取命中:每百萬個符記 $0.04 美元 |
Claude 3.5 Sonnet v2 | 輸入:每百萬個符記 $3 美元 輸出:每百萬個符記 $15 美元 批次輸入:每百萬個符記 $1.5 美元 批次輸出:每百萬個符記 $7.5 美元 快取寫入:每百萬個符記 $3.75 美元 快取命中:每百萬個符記 $0.30 美元 批次快取寫入:每百萬個符記 $1.875 美元 批次快取命中:每百萬個符記 $0.15 美元 |
Claude 3.5 Sonnet | 輸入:每百萬個符記 $3 美元 輸出:每百萬個符記 $15 美元 快取寫入:每百萬個符記 $3.75 美元 快取命中:每百萬個符記 $0.30 美元 |
Claude 3 Haiku | 輸入:每百萬個符記 $0.25 美元 輸出:每百萬個符記 $1.25 美元 快取寫入:每百萬個符記 $0.30 美元 快取命中:每百萬個符記 $0.03 美元 |
Claude 3 Sonnet (deprecated) | 輸入:每百萬個詞元 $3 美元 輸出:每百萬個詞元 $15 美元 |
Claude 3 Opus | 輸入:每 100 萬個符號 $15 美元 輸出:每 100 萬個符號 $75 美元 快取寫入:每 100 萬個符號 $18.75 美元 快取命中:每 100 萬個符號 $1.50 美元 |
Meta 的 Llama 模型
模型 | 定價 |
---|---|
Llama 3.1 405B | 輸入:每百萬個詞元 $5.00 美元 輸出:每百萬個詞元 $16.00 美元 |
Llama 3.3 700 億 * | 輸入:每百萬個符記 $0.72 美元 輸出:每百萬個符記 $0.72 美元 |
Llama 4 Scout * | 輸入:每百萬個符記 $0.25 美元 輸出:每百萬個符記 $0.70 美元 |
小馬 4 馬維克 * | 輸入:每百萬個字元 $0.35 美元 輸出:每百萬個字元 $1.15 美元 |
- 2025 年 5 月 1 日前免費
Mistral AI 的模型
模型 | 定價 |
---|---|
Mistral OCR (25.05) | 輸入:每百萬個詞元 $0.0005 美元 (或每頁 $0.0005 美元) 輸出:每百萬個詞元 $0.0005 美元 (或每頁 $0.0005 美元) |
Mistral Small 3.1 (25.03) | 輸入:每百萬個詞元 $0.10 美元 輸出:每百萬個詞元 $0.30 美元 |
Mistral Large (24.11) | 輸入:每 100 萬個詞元 $2.00 美元 輸出:每 100 萬個詞元 $6.00 美元 |
Mistral 尼莫 | 輸入:每百萬個符記 $0.15 美元 輸出:每百萬個符記 $0.15 美元 |
Codestral (25.01) | 輸入:每百萬個字元 $0.30 美元 輸出:每百萬個字元 $0.90 美元 |