Esta página se ha traducido con Cloud Translation API.

Costo de construcción e implementación de modelos de IA en Vertex AI

Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .

Solo se le cobrará por las solicitudes que devuelvan un código de respuesta 200. Las solicitudes que devuelvan cualquier otro código de respuesta, como los códigos 4xx y 5xx, no se cobrarán por la entrada ni la salida.

Esta página describe los precios de la IA Generativa en Vertex AI. Para conocer los demás precios de Vertex AI, incluyendo la Plataforma de Aprendizaje Automático y los servicios MLOps, consulte la página de precios de Vertex AI .

Modelos de Google

Géminis 2.5

Modelo	Tipo	Precio (/1M tokens) <= 200K tokens de entrada	Precio (/1M tokens) > 200K tokens de entrada	Precio (/1M tokens) <= 200K tokens de entrada con API por lotes	Precio (/1M tokens) > 200K tokens de entrada con API por lotes
Géminis 2.5 Pro
	Entrada (texto, imagen, vídeo, audio)	$1.25	$2.5	$0.625	$1.25
	Salida de texto (respuesta y razonamiento)	$10	$15	$5	$7.5
Géminis 2.5 Flash GA
	Entrada (texto, imagen, vídeo)	$0.30	$0.30	$0.15	$0.15
	Entrada de audio	$1	$1	$0.5	$0.5
	Salida de texto	$2.50	$2.50	$1.25	$1.25
	Ajuste para 1 millón de tokens de entrenamiento	$5.00	N / A	N / A	N / A
Vista previa de Flash de Gemini 2.5 (Puntos finales retirados el 15/07/2025)
	Entrada (texto, imagen, vídeo)	$0.15	$0.15	$0.075	$0.075
	Entrada de audio	$1	$1	$0.5	$0.5
	Salida de texto (sin pensar)	$0.60	$0.60	$0.30	$0.30
	Salida de texto (pensamiento-respuesta y razonamiento)	$3.50	$3.50	$1.75	$1.75
API en vivo de Flash Gemini 2.5
	1 millón de tokens de texto de entrada	$0.5	$0.5	N / A	N / A
	1 millón de tokens de audio de entrada	$3	$3	N / A	N / A
	1 millón de tokens de vídeo de entrada	$3	$3	N / A	N / A
	1 millón de tokens de texto de salida	$2	$2	N / A	N / A
	1 millón de tokens de audio de salida	$12	$12	N / A	N / A
Gemini 2.5 Flash Lite
	Entrada (texto, imagen, vídeo)	$0.1	$0.1	N / A	N / A
	Entrada de audio	$0.5	$0.5	N / A	N / A
	Salida de texto (respuesta y razonamiento)	$0.4	$0.4	N / A	N / A
Conexión a tierra con la Búsqueda de Google	Gemini 2.0 Flash , 2.5 Flash y 2.5 Flash-Lite incluyen un total de 1500 indicaciones de conexión a tierra al día sin costo adicional. Gemini 2.5 Pro incluye 10 000 indicaciones de conexión a tierra al día sin costo adicional. Los avisos puestos a tierra que excedan esos límites se facturarán a $35 por cada 1000 avisos puestos a tierra . Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google**. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.
Puesta a tierra web para empresas	$45 por cada 1000 solicitudes de acceso a la base . Una solicitud de acceso a la base es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas**. Incluso si se envían varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por solicitud de acceso a la base. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.
Conexión a tierra con sus datos	$2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025.

* Si un contexto de entrada de consulta tiene más de 200 000 tokens, todos los tokens (de entrada y de salida) se cobran a tarifas de contexto largo.
** La conexión a tierra con la Búsqueda de Google y la Conexión a Tierra Web para empresas se factura solo cuando una solicitud devuelve correctamente resultados web (es decir, resultados que contienen al menos una URL de soporte de conexión a tierra desde la web). Las tarifas de uso del modelo Gemini se aplican por separado.

Géminis 2.0

Gemini 2.0 se factura por tokens. Para calcular la cantidad de tokens de entrada en su solicitud antes de enviarla, puede usar el tokenizador del SDK o la API countTokens . Si su solicitud falla con un error 400 o 500, no se le cobrarán los tokens utilizados.

Utilice el interruptor en la tabla de precios para comparar los precios basados en tokens y los precios basados en modalidades.

Precios basados en tokens

Modelo	Tipo	Precio	Precio con API por lotes
Flash Géminis 2.0
	1 millón de tokens de entrada	$0.15	$0.075
	1 millón de tokens de audio de entrada	$1.00	$0.50
	1 millón de tokens de texto de salida	$0.60	$0.30
	Ajuste para 1 millón de tokens de entrenamiento	$3.00
Generación de imágenes Flash Gemini 2.0
	1 millón de tokens de entrada	$0.15
	1 millón de tokens de audio de entrada	$1.00
	1 millón de tokens de vídeo de entrada	$3
	1 millón de tokens de texto de salida	$0.60
	1 millón de tokens de imagen de salida	$30.00
API en vivo de Flash Gemini 2.0
	1 millón de tokens de texto de entrada	$0.5
	1 millón de tokens de audio de entrada	$3
	1 millón de tokens de vídeo de entrada	$3
	1 millón de tokens de texto de salida	$2
	1 millón de tokens de audio de salida	$12
Gemini 2.0 Flash Lite
	1 millón de tokens de entrada	$0.075	$0.0375
	1 millón de tokens de audio de entrada	$0.075	$0.0375
	1 millón de tokens de texto de salida	$0.30	$0.15
	Ajuste para 1 millón de tokens de entrenamiento	$1.00
Conexión a tierra con la Búsqueda de Google	Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1.500 indicaciones fundamentadas por día sin costo adicional. Los avisos puestos a tierra que excedan esos límites se facturarán a $35 por cada 1000 avisos puestos a tierra . Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.
Puesta a tierra web para empresas	$45 por cada 1000 solicitudes de acceso a la base . Una solicitud de acceso a la base es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por solicitud de acceso a la base. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.
Conexión a tierra con sus datos	$2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025.

Precios basados en modalidades

Los precios de las modalidades que se indican a continuación se basan en casos de uso promedio, solo como referencia. La facturación real se basará únicamente en tokens:

4 caracteres dan como resultado aproximadamente 1 token de texto, incluido el espacio en blanco.
Para una imagen de 1024x1024, se consumen 1290 tokens. El número de tokens por imagen varía según la resolución. Para más información sobre cómo calcular los tokens, consulte nuestra documentación .
La entrada de video consume 258 tokens por segundo a una frecuencia de muestreo de un fotograma por segundo. El video con audio factura tanto los tokens de video como los de audio.
La entrada de audio consume 25 tokens por segundo sin marca de tiempo.

Modelo	Tipo	Precio	Precio con API por lotes
Flash Géminis 2.0
	Texto de entrada ($/M char)	$0.0375	$0.01875
	Imagen de entrada ($/imagen)	$0.0001935	$0.00009675
	Vídeo de entrada ($/seg)	$0.0000387	$0.00001935
	Entrada de audio ($/seg)	$0.000025	$0.0000125
	Texto de salida ($/M char)	$0.15	$0.075
Generación de imágenes Flash Gemini 2.0
	Texto de entrada ($/M char)	$0.0375
	Imagen de entrada ($/imagen)	$0.0001935
	Vídeo de entrada ($/seg)	$0.0000387
	Entrada de audio ($/seg)	$0.000025
	Texto de salida ($/M char)	$0.15
	Imagen de salida imagen ($/imagen)	$0.04
Gemini 2.0 Flash Lite
	Texto de entrada ($/M char)	$0.01875	$0.009375
	Imagen de entrada ($/imagen)	$0.00009675	$0.000048375
	Vídeo de entrada ($/seg)	$0.00001935	$0.000009675
	Entrada de audio ($/seg)	$0.000001875	$0.000000938
	Texto de salida ($/M char)	$0.075	$0.0375
Conexión a tierra con la Búsqueda de Google	Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1.500 indicaciones fundamentadas por día sin costo adicional. Los avisos puestos a tierra que excedan esos límites se facturarán a $35 por cada 1000 avisos puestos a tierra . Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.
Puesta a tierra web para empresas	$45 por cada 1000 solicitudes de acceso a la base . Una solicitud de acceso a la base es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por solicitud de acceso a la base. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.

* Los precios están expresados en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
* Los tokens de entrenamiento se calculan mediante la cantidad total de tokens en su conjunto de datos de entrenamiento, multiplicado por la cantidad de épocas.
* Los archivos PDF se facturan como entrada de imagen, y una página PDF equivale a una imagen.
* El punto final del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google y la Conexión a Tierra Web para empresas se factura solo cuando una solicitud devuelve correctamente resultados web (es decir, resultados que contienen al menos una URL de soporte de conexión a tierra desde la web). Las tarifas de uso del modelo Gemini se aplican por separado.
* API Gemini 2.0 Flash Live: 25 tokens por segundo de audio (entrada/salida), 258 tokens por segundo de vídeo (entrada). La conexión a tierra con la Búsqueda de Google sigue siendo gratuita mientras la API Gemini 2.0 Flash Live esté en versión preliminar.

Precios del Optimizador de modelos Vertex AI (experimental)*

Vertex AI Model Optimizer simplifica el uso de Gemini para clientes empresariales al proporcionar un único metapunto final para las solicitudes de modelos de Gemini. Los clientes que utilizan este servicio no tienen que especificar si usan Flash, Pro o una versión específica. Simplemente proporcionan una configuración (costo, calidad o equilibrio) para indicar sus preferencias, y Model Optimizer aplica el nivel de inteligencia adecuado para la tarea, enviando cada consulta al modelo más adecuado.

Vertex AI Model Optimizer aplica precios dinámicos. Esto significa que el precio promedio por token depende del nivel de inteligencia del modelo aplicado para completar la tarea. Por ello, a continuación se ofrecen ejemplos de precios para ilustrar posibles escenarios según su configuración (consulte las tablas a continuación). Los SKU de Model Optimizer cuestan $1 y funcionan como una unidad de compra para su facturación. Se le facturará según el consumo después de usar los modelos.

Relación E/S 5:1	Ejemplo 1 bot de chat	NOTA: estos rangos no son garantías, los resultados individuales de cada cliente pueden variar.
Preferencia del cliente	Tokens de entrada del cliente enviados a MO	Tokens de salida del cliente enviados a MO	Precio de entrada promedio por millón de tokens (rango alto)	Precio de salida promedio por millón de tokens (rango alto)	Precio de entrada promedio por millón de tokens (rango bajo)	Precio de salida promedio por millón de tokens (rango bajo)
Costo	10.000.000	2.000.000	$0.63	$2.50	$0.16	$0.63
Equilibrado	10.000.000	2.000.000	$1.26	$5.00	$0.63	$2.50
Calidad	10.000.000	2.000.000	$1.89	$7.50	$1.26	$5.00

Relación E/S 1:20	Ejemplo 2 Generación de contenido
Preferencia del cliente	Tokens de entrada del cliente enviados a MO	Tokens de salida del cliente enviados a MO	Precio de entrada promedio por millón de tokens (rango alto)	Precio de salida promedio por millón de tokens (rango alto)	Precio de entrada promedio por millón de tokens (rango bajo)	Precio de salida promedio por millón de tokens (rango bajo)
Costo	1.000.000	20.000.000	$0.63	$2.50	$0.16	$0.63
Equilibrado	1.000.000	20.000.000	$1.26	$5.00	$0.63	$2.50
Calidad	1.000.000	20.000.000	$1.89	$7.50	$1.26	$5.00

* Model Optimizer es una oferta experimental paga y puede dirigir solicitudes a versiones experimentales de Gemini en Vertex.

Otros modelos de Gemini

Todos los modelos de Gemini, excepto Gemini 2.0, se facturan según modalidades como caracteres, imágenes y segundos de vídeo/audio. La entrada de texto se factura por cada 1000 caracteres de entrada (indicación) y por cada 1000 caracteres de salida (respuesta). Los caracteres se contabilizan mediante puntos de código UTF-8 y se excluyen los espacios en blanco, lo que resulta en aproximadamente 4 caracteres por token. Las solicitudes de predicción que generan respuestas filtradas se facturan solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 $) se redondean a un céntimo. La entrada multimedia se factura por imagen o por segundo (vídeo). Si su solicitud falla con un error 400 o 500, no se le cobrarán los tokens utilizados.

Modelo	Característica	Tipo	Precio (=< 128K tokens de entrada)	Precio (> 128K tokens de entrada)
Géminis 1.5 Flash	Multimodal	Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio	$0.00002 / imagen $0.00002 / segundo $0.00001875 / 1k caracteres $0.000002 / segundo	$0.00004 / imagen $0.00004 / segundo $0.0000375 / 1k caracteres $0.000004 / segundo
		Salida de texto	$0.000075 / 1k caracteres	$0.00015 / 1k caracteres
	Sintonización*	Token de entrenamiento	$8/M tokens
Géminis 1.5 Pro	Multimodal	Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio	$0.00032875 / imagen $0.00032875 / segundo $0.0003125 / 1k caracteres $0.00003125 / segundo	$0.0006575 / imagen $0.0006575 / segundo $0.000625 / 1k caracteres $0.0000625 / segundo
		Salida de texto	$0.00125 / 1k caracteres	$0.0025 / 1k caracteres
	Sintonización*	Token de entrenamiento	$80/M tokens
Géminis 1.0 Pro	Multimodal	Entrada de imagen Entrada de vídeo Entrada de texto	$0.0025 / imagen $0.002/segundo $0.000125 / 1k caracteres
Géminis 1.0 Pro		Salida de texto	$0.000375 / 1k caracteres
Conexión a tierra con la Búsqueda de Google	Texto	$35 por cada 1.000 indicaciones fundamentadas . Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.
Puesta a tierra web para empresas	Texto	$45 por cada 1.000 indicaciones fundamentadas . Una solicitud con base en la web es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud con base en la web. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.
Conexión a tierra con sus datos	Texto	$2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025.

* Los precios están expresados en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
* Si un contexto de consulta tiene más de 128K, todos los tokens se cobran a tarifas de contexto largo.
*Los modelos Gemini están disponibles en modo lote con un 50% de descuento.
* Gemini 1.0 Pro solo admite ventanas de contexto de hasta 32 K.
* Los archivos PDF se facturan como entrada de imagen, y una página PDF equivale a una imagen.
* El punto final del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google y la Conexión a Tierra Web para empresas se factura solo cuando una solicitud devuelve correctamente resultados web (es decir, resultados que contienen al menos una URL de soporte de conexión a tierra desde la web). Las tarifas de uso del modelo Gemini se aplican por separado.

Imagen

Con Imagen en Vertex AI, puede generar imágenes nuevas y editar imágenes según las indicaciones de texto que proporcione, o editar solo partes de las imágenes utilizando un área de máscara que defina junto con una serie de otras capacidades.

Modelo	Característica	Descripción	Aporte	Producción	Precio
Imagen 4 Ultra	Generación de imágenes	Generar una imagen	Mensaje de texto	Imagen	$0,06 por imagen
Imagen 4	Generación de imágenes	Generar una imagen	Mensaje de texto	Imagen	$0.04 por imagen
Imagen 4 Fast	Generación de imágenes	Generar una imagen	Mensaje de texto	Imagen	$0.02 por imagen
Imagen 3	Generación de imágenes	Generar una imagen Editar una imagen Personalizar una imagen	Mensaje de texto	Imagen	$0.04 por imagen
Imagen 3 rápida	Generación de imágenes	Generar una imagen	Mensaje de texto	Imagen	$0.02 por imagen
Imagen 2, Imagen	Generación de imágenes	Generar una imagen	Mensaje de texto	Imagen	$0.020 por imagen
	Edición de imágenes	Editar una imagen usando el método de máscara libre o máscara	Aviso de imagen/texto	Imagen	$0.020 por imagen
	Ampliación de escala	Aumentar la resolución de una imagen generada a 2k y 4k	Imagen	Imagen	$0.003 por imagen
	Sintonia FINA	Habilitar un "sujeto" proporcionado por el usuario para utilizarlo en indicaciones de Imagen (entrenamiento de pocas tomas)	Tema(s) con identificador de texto y 4-8 imágenes por tema	Modelo afinado (después del entrenamiento con sujetos proporcionados por el usuario)	$ por hora de nodo (precio de capacitación personalizada de Vertex AI)
	Subtítulos visuales	Generar un título de texto corto o largo para una imagen	Imagen	Título del texto	$0.0015/image
	Preguntas y respuestas visuales	Proporcionar una respuesta basada en una pregunta que haga referencia a una imagen	Aviso de imagen/texto	Respuesta de texto	$0.0015/image

Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .

Veo

Veo 2 crea videos de increíble calidad en una amplia gama de temas y estilos, brindando una mejor comprensión de la física del mundo real y los matices del movimiento y la expresión humana.

Modelo	Característica	Descripción	Aporte	Producción	Precio
Veo 3	Generación de vídeo	Generar vídeos a partir de un mensaje de texto o una imagen de referencia	Aviso de texto/imagen	Video	$0,50/segundo
Veo 3	Generación de video + audio	Genere un video con efectos de sonido/voz sincronizados a partir de un mensaje de texto o una imagen de referencia.	Aviso de texto/imagen	Vídeo + Audio	$0,75/segundo
Veo 2	Generación de vídeo	Generar vídeos a partir de un mensaje de texto o una imagen de referencia	Aviso de texto/imagen	Video	$0,50/segundo
Veo 2	Controles avanzados	Genere videos mediante interpolación de fotogramas iniciales y finales, amplíe los videos generados y aplique controles de cámara	Mensaje de texto/imagen/vídeo	Video	$0,50/segundo

Liria

Lyria 2 ofrece generación de música instrumental de alta calidad que es ideal para composiciones sofisticadas y exploración creativa detallada donde un resultado matizado es clave.

Modelo	Característica	Descripción	Aporte	Producción	Precio
Lyria 2	Generación musical	Generar música a partir de un mensaje de texto	Mensaje de texto	Música	$0,06 por 30 segundos

Comprenda los costos de integración de sus aplicaciones de IA

Modelo	Tipo	Región	Precio por cada 1000 tokens de entrada
Incrustación de Géminis	Aporte	Global	Solicitudes en línea: $0.00015 Solicitudes por lotes: $0.00012
Incrustación de Géminis	Producción	Global	Solicitudes en línea: Sin costo Solicitudes por lotes: Sin cargo

Modelo	Tipo	Región	Precio por cada 1.000 caracteres
Incrustaciones de texto (Excluyendo la incrustación de Gemini)	Aporte	Global	Solicitudes en línea: $0.000025 Solicitudes por lotes: $0.00002
	Producción	Global	Solicitudes en línea: Sin costo Solicitudes por lotes: Sin cargo

Modelo	Característica	Descripción	Aporte	Producción	Precio
incrustación multimodal	Incrustaciones para multimodal: texto	Generar incrustaciones usando texto como entrada	Texto	Incrustaciones	$0.0002 / 1k caracteres de entrada
	Incrustaciones para multimodal: imagen	Generar incrustaciones usando la imagen como entrada	Imagen	Incrustaciones	$0.0001 / entrada de imagen
	Incrustaciones para multimodal: Video Plus	Vídeo Plus	Video	Incrustaciones (hasta 15 incrustaciones por minuto de vídeo)	$0,0020 por segundo de vídeo
	Incrustaciones para multimodal: estándar de vídeo	Estándar de vídeo	Video	Incrustaciones (hasta 8 incrustaciones por minuto de vídeo)	$0,0010 por segundo de vídeo
	Incrustaciones para multimodal: video esencial	Vídeo esencial	Video	Incrustaciones (hasta 4 incrustaciones por minuto de vídeo)	$0,0005 por segundo de vídeo

Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .

Precios de finalización de código de Vertex AI

La IA generativa en Vertex AI cobra por cada 1000 caracteres de entrada (solicitud) y cada 1000 caracteres de salida (respuesta). Los caracteres se contabilizan mediante puntos de código UTF-8 y se excluyen los espacios en blanco. Durante la fase de vista previa, los cargos tienen un descuento del 100 %. Las solicitudes de predicción que generan respuestas filtradas se cobran solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 $) se redondean a un céntimo.

Modelo	Tipo	Región	Precio por cada 1.000 caracteres
Codey para completar código	Aporte	Global	Solicitudes en línea: $0.00025
Codey para completar código	Producción	Global	Solicitudes en línea: $0.0005

Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .

Traducción (Texto)

Utilice la API de Vertex AI y Translation LLM para traducir texto. Las traducciones LLM suelen ser más fluidas y con un sonido más humano que los modelos de traducción clásicos, pero su compatibilidad con otros idiomas es más limitada (Más información) .

Modelo	Método	Uso	Precio por millón de caracteres
Maestría en Derecho	Traducción del texto ^*	El número de caracteres de entrada por mes	$10 por millón de caracteres ^*
	Traducción del texto ^*	El número de caracteres de salida por mes	$10 por millón de caracteres ^*

Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
^* El precio es por carácter procesado por el modelo. Para más información sobre los caracteres contados, consulte Caracteres facturados.

Optimice los costos con el almacenamiento en caché de contexto de Vertex AI

Con el almacenamiento en caché de contexto, puede reducir el costo del procesamiento de tokens de entrada de Gemini en un 75% y la latencia de la generación de contenido al almacenar en caché la parte contextual de su texto o contenido multimedia de entrada en modelos de Gemini. El tiempo que los datos se almacenan en la caché, controlable por el usuario, determina los cargos por "Almacenamiento en caché de contexto". Al crear un contexto en caché, se cobrará a los usuarios el costo estándar de tokens de entrada. Las visitas a la caché de datos de entrada se cobran a una tarifa reducida, "Entrada en caché", en lugar del costo de entrada normal. El tamaño de los datos, tanto para el almacenamiento como para la entrada, se calcula de la misma manera que el precio de entrada de Gemini.

Modelos Gemini 2.5

Modelo	Característica	Tipo	Precio (/1M tokens) <= 200K tokens de entrada	Precio (/1M tokens) > 200K tokens de entrada
Géminis 2.5 Pro	Entrada en caché	Entrada (texto, imagen, vídeo, audio)	$0,31 (/1 millón de tokens)	$0,625 (/1 millón de tokens)
		Producción	N / A	N / A
	Almacenamiento de caché de contexto	Entrada (texto, imagen, vídeo, audio)	$4.5 (/M Tok/hora)	$4.5 (/M Tok/hora)
Géminis 2.5 Flash	Entrada en caché	Entrada (texto, imagen, vídeo, audio)	$0.0375 (/1 millón de tokens)	$0.0375 (/1 millón de tokens)
		Producción	N / A	N / A
	Almacenamiento de caché de contexto	Entrada (texto, imagen, vídeo, audio)	$1 (/M Tok/hora)	$1 (/M Tok/hora)

Modelos Gemini 2.0

Precios basados en tokens

Modelo	Tipo	Almacenamiento (M tok-hora)	Precio
Flash Géminis 2.0
	1 millón de tokens de entrada	$1.00	$0.0375
	1 millón de tokens de audio de entrada	$1.00	$0.25
	1 millón de tokens de texto de salida	N / A	N / A
Gemini 2.0 Flash Lite
	1 millón de tokens de entrada	$1.00	$0.01875
	1 millón de tokens de audio de entrada	$1.00	$0.01875
	1 millón de tokens de texto de salida	N / A	N / A

Precios basados en modalidades

Los precios de las modalidades que se indican a continuación se basan en casos de uso promedio, solo como referencia. La facturación real se basará únicamente en tokens:

4 caracteres dan como resultado aproximadamente 1 token de texto, incluido el espacio en blanco.
Para una imagen de 1024x1024, se consumen 1290 tokens. El número de tokens por imagen varía según la resolución. Para más información sobre cómo calcular los tokens, consulte nuestra documentación .
La entrada de video consume 258 tokens por segundo a una frecuencia de muestreo de un fotograma por segundo. El video con audio factura tanto los tokens de video como los de audio.
La entrada de audio consume 25 tokens por segundo sin marca de tiempo.

Modelo	Tipo	Almacenamiento (Modalidad-hora)	Precio
Flash Géminis 2.0
	Texto de entrada ($/M char)	$0.25	$0.009375
	Imagen de entrada ($/imagen)	$0.00129	$0.000048375
	Vídeo de entrada ($/seg)	$0.000258	$0.000009675
	Entrada de audio ($/seg)	$0.000025	$0.00000625
	Texto de salida ($/M char)	N / A	N / A
Gemini 2.0 Flash Lite
	Texto de entrada ($/M char)	$0.25	$0.0046875
	Imagen de entrada ($/imagen)	$0.00129	$0.0000241875
	Vídeo de entrada ($/seg)	$0.000258	$0.000009675
	Entrada de audio ($/seg)	$0.000258	$0.0000048375
	Texto de salida ($/M char)	N / A	N / A
Conexión a tierra con la Búsqueda de Google	Gemini 2.0 Flash incluye hasta 1500 solicitudes con garantía por día sin costo adicional. Solicitudes con garantía. Los excedentes de 1.500 por día se facturan a $35 por cada 1.000 solicitudes (hasta 1 millón de solicitudes por día). Comuníquese con su equipo de cuentas si necesita más de 1 millón de solicitudes por día.
Puesta a tierra web para empresas	$45 por cada 1000 solicitudes (hasta 1 millón de solicitudes por día) a partir del 5 de mayo de 2025. Comuníquese con su equipo de cuentas si necesita más de 1 millón de solicitudes por día.

* Los precios están expresados en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
* Los archivos PDF se facturan como entrada de imagen, y una página PDF equivale a una imagen.
* El punto final del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google se factura solo para solicitudes que devuelvan resultados que contengan al menos una URL de soporte de conexión a tierra desde la web. También se aplican las tarifas de uso del modelo estándar de Gemini.

Rendimiento aprovisionado

El rendimiento aprovisionado garantiza el rendimiento para sus necesidades de IA generativa y se gestiona mediante unidades de escala de IA generativa (GSU). Obtenga más información sobre el rendimiento que proporciona cada GSU aquí y utilice nuestro estimador en línea aquí .

Duración	Precio por GSU	Por
Compromiso de 1 semana	$1,200	Semana
Compromiso de 1 mes	$2,700	Mes
Compromiso de 3 meses	$2,400	Mes
Compromiso de 1 año	$2,000	Mes

Ejemplo de cálculo de costes

Un usuario debe asegurarse de que puede soportar 10 consultas por segundo (QPS) de una consulta con una entrada de 1000 tokens de texto y 500 tokens de audio y recibir una salida de 300 tokens de texto utilizando gemini-2.0-flash.

Usando la tabla de rendimiento y tasa de evolución, para gemini-2.0-flash sabemos que la tasa de evolución de un token de texto de entrada es de 1 token, la tasa de evolución de un token de audio de entrada es de 7 tokens y la tasa de evolución de un token de texto de salida es de 4 tokens.

El total de tokens de entrada del usuario es de 1000* (1 token por cada token de texto de entrada) + 500* (7 tokens por cada token de audio de entrada) = 4500 tokens de entrada ajustados a la evolución. El total de tokens de salida del usuario es de 300* (4 tokens por cada token de texto de salida) = 1200 tokens de salida ajustados a la evolución. Al sumarlos, obtenemos 4500 tokens de entrada ajustados a la evolución + 1200 tokens de salida ajustados a la evolución = 5700 tokens en total por consulta.

Al multiplicar el total de tokens por consulta por QPS, obtenemos 5700 tokens totales por consulta * 10 QPS = 57 000 tokens totales por segundo.

Dividiendo esto entre el rendimiento total por segundo por GSU, obtenemos 57 000 tokens por segundo ÷ 3360 de rendimiento por segundo por GSU = 16,96 GSU. El incremento mínimo de compra de GSU para este modelo es de 1, por lo que el usuario necesitaría 17 GSU.

Si el usuario quisiera mantener este rendimiento durante una semana, el costo sería de $1200 * 17 GSU = $20 400 semanales. Si quisiera mantener este rendimiento durante un mes, el costo sería de $2700 * 17 GSU = $45 900 mensuales. Si quisiera mantener este rendimiento durante tres meses, el costo sería de $2400 * 17 GSU = $40 800 mensuales. Y, por último, si quisiera mantener este rendimiento durante un año, el costo sería de $2000 * 17 GSU = $34 000 mensuales.

Compare precios de modelos de socios en Vertex AI

Los modelos de socios son una lista seleccionada de modelos de IA generativa desarrollados por socios de Google. Se ofrecen como API administradas. Para obtener más información, consulte la sección "Descripción general de los modelos de socios ". En las siguientes secciones se detallan los precios de los modelos de socios de Google.

Modelos de AI21 Lab

Modelo	Precios
Jamba 1.5 Grande	Entrada: $2/millón de tokens Salida: $8/millón de tokens
Jamba 1.5 Mini	Entrada: $0,20/millón de tokens Salida: $0,40/millón de tokens

Los modelos Claude de Anthropic

Modelo	Precios
Claude Opus 4	Entrada: $15/millón de tokens Salida: $75/millón de tokens Entrada por lotes: $7,50/millón de tokens Producción por lotes: $37,50/millón de tokens Escritura en caché: $18,75/millón de tokens Golpe de caché: $1,50/millón de tokens Escritura de caché por lotes: $9,375/millón de tokens Impacto de caché por lotes: $0,75/millón de tokens
Soneto 4 de Claude	Entrada: $3/millón de tokens Salida: $15/millón de tokens Entrada por lotes: $1,50/millón de tokens Producción por lotes: $7,50/millón de tokens Escritura en caché: $3,75/millón de tokens Impacto de caché: $0,30/millón de tokens Escritura de caché por lotes: $1,875/millón de tokens Impacto de caché por lotes: $0,15/millón de tokens
Soneto Claude 3.7	Entrada: $3/millón de tokens Salida: $15/millón de tokens Entrada por lotes: $1,50/millón de tokens Producción por lotes: $7,50/millón de tokens Escritura en caché: $3,75/millón de tokens Impacto de caché: $0,30/millón de tokens Escritura de caché por lotes: $1,875/millón de tokens Impacto de caché por lotes: $0,15/millón de tokens
Haiku de Claude 3.5	Entrada: $0,80/millón de tokens Salida: $4/millón de tokens Entrada por lotes: $0,40/millón de tokens Producción por lotes: $2/millón de tokens Escritura en caché: $1/millón de tokens Impacto de caché: $0,08/millón de tokens Escritura de caché por lotes: $0,50/millón de tokens Impacto de caché por lotes: $0,04/millón de tokens
Claude 3.5 Soneto v2	Entrada: $3/millón de tokens Salida: $15/millón de tokens Entrada por lotes: $1,50/millón de tokens Producción por lotes: $7,50/millón de tokens Escritura en caché: $3,75/millón de tokens Impacto de caché: $0,30/millón de tokens Escritura de caché por lotes: $1,875/millón de tokens Impacto de caché por lotes: $0,15/millón de tokens
Soneto Claude 3.5	Entrada: $3/millón de tokens Salida: $15/millón de tokens Escritura en caché: $3,75/millón de tokens Impacto de caché: $0,30/millón de tokens
Haiku de Claude 3	Entrada: $0,25/millón de tokens Salida: $1,25/millón de tokens Escritura en caché: $0,30/millón de tokens Impacto de caché: $0,03/millón de tokens
Claude 3 Sonnet (deprecated)	Entrada: $3/millón de tokens Salida: $15/millón de tokens
Claude 3 Opus	Entrada: $15/millón de tokens Salida: $75/millón de tokens Escritura en caché: $18,75/millón de tokens Golpe de caché: $1,50/millón de tokens

Modelos de llama de Meta

Modelo	Precios
Llama 3.1 405B	Entrada: $5.00 / millón de tokens Salida: $16,00/millón de tokens
Llama 3.3 70B *	Entrada: $0,72/millón de tokens Salida: $0,72/millón de tokens
Llama 4 Scout *	Entrada: $0,25/millón de tokens Salida: $0,70/millón de tokens
Llama 4 Maverick *	Entrada: $0,35/millón de tokens Salida: $1,15/millón de tokens

Disponible sin cargo hasta el 1 de mayo de 2025.

Modelos de Mistral AI

Modelo	Precios
Mistral OCR (25.05)	Entrada: $0,0005/millón de tokens (o $0,0005/página) Salida: $0,0005/millón de tokens (o $0,0005/página)
Mistral Pequeño 3.1 (25.03)	Entrada: $0,10/millón de tokens Salida: $0,30/millón de tokens
Mistral Grande (24.11)	Entrada: $2.00 / millón de tokens Salida: $6,00/millón de tokens
Mistral Nemo	Entrada: $0,15/millón de tokens Salida: $0,15/millón de tokens
Codestral (25.01)	Entrada: $0,30/millón de tokens Salida: $0,90/millón de tokens

Solicitar una cotización personalizada

Con el plan de pago por uso de Google Cloud, solo pagas por los servicios que usas. Contacta con nuestro equipo de ventas para obtener un presupuesto personalizado para tu organización.

Contactar con ventas

Costo de construcción e implementación de modelos de IA en Vertex AI

Modelos de Google

Géminis 2.5

Géminis 2.0

Precios basados ​​en tokens

Precios basados ​​en modalidades

Precios del Optimizador de modelos Vertex AI (experimental)*

Otros modelos de Gemini

Imagen

Veo

Liria

Comprenda los costos de integración de sus aplicaciones de IA

Precios de finalización de código de Vertex AI

Traducción (Texto)

Optimice los costos con el almacenamiento en caché de contexto de Vertex AI

Modelos Gemini 2.5

Modelos Gemini 2.0

Precios basados ​​en tokens

Precios basados ​​en modalidades

Rendimiento aprovisionado

Ejemplo de cálculo de costes

Compare precios de modelos de socios en Vertex AI

Modelos de AI21 Lab

Los modelos Claude de Anthropic

Modelos de llama de Meta

Modelos de Mistral AI

Solicitar una cotización personalizada

Precios basados en tokens

Precios basados en modalidades

Precios basados en tokens

Precios basados en modalidades