Costo de construcción e implementación de modelos de IA en Vertex AI

Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .

Solo se le cobrará por las solicitudes que devuelvan un código de respuesta 200. Las solicitudes que devuelvan cualquier otro código de respuesta, como los códigos 4xx y 5xx, no se cobrarán por la entrada ni la salida.

Esta página describe los precios de la IA Generativa en Vertex AI. Para conocer los demás precios de Vertex AI, incluyendo la Plataforma de Aprendizaje Automático y los servicios MLOps, consulte la página de precios de Vertex AI .

Modelos de Google

Géminis 2.5

Modelo Tipo Precio (/1M tokens) <= 200K tokens de entrada Precio (/1M tokens) > 200K tokens de entrada Precio (/1M tokens) <= 200K tokens de entrada con API por lotes Precio (/1M tokens) > 200K tokens de entrada con API por lotes
Géminis 2.5 Pro
Entrada (texto, imagen, vídeo, audio) $1.25 $2.5 $0.625 $1.25
Salida de texto (respuesta y razonamiento) $10 $15 $5 $7.5


Géminis 2.5
Flash GA
Entrada (texto, imagen, vídeo) $0.30 $0.30 $0.15 $0.15
Entrada de audio $1 $1 $0.5 $0.5
Salida de texto $2.50 $2.50 $1.25 $1.25
Ajuste para 1 millón de tokens de entrenamiento $5.00 N / A N / A N / A




Vista previa de Flash de Gemini 2.5
(Puntos finales retirados el 15/07/2025)
Entrada (texto, imagen, vídeo) $0.15 $0.15 $0.075 $0.075
Entrada de audio $1 $1 $0.5 $0.5
Salida de texto (sin pensar) $0.60 $0.60 $0.30 $0.30
Salida de texto (pensamiento-respuesta y razonamiento) $3.50 $3.50 $1.75 $1.75




API en vivo de Flash Gemini 2.5
1 millón de tokens de texto de entrada $0.5 $0.5 N / A N / A
1 millón de tokens de audio de entrada $3 $3 N / A N / A
1 millón de tokens de vídeo de entrada $3 $3 N / A N / A
1 millón de tokens de texto de salida $2 $2 N / A N / A
1 millón de tokens de audio de salida $12 $12 N / A N / A



Gemini 2.5 Flash Lite
Entrada (texto, imagen, vídeo) $0.1 $0.1 N / A N / A
Entrada de audio $0.5 $0.5 N / A N / A
Salida de texto (respuesta y razonamiento) $0.4 $0.4 N / A N / A


Conexión a tierra con la Búsqueda de Google
Gemini 2.0 Flash , 2.5 Flash y 2.5 Flash-Lite incluyen un total de 1500 indicaciones de conexión a tierra al día sin costo adicional. Gemini 2.5 Pro incluye 10 000 indicaciones de conexión a tierra al día sin costo adicional.

Los avisos puestos a tierra que excedan esos límites se facturarán a $35 por cada 1000 avisos puestos a tierra .

Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google**. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos.

Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.

Puesta a tierra web para empresas
$45 por cada 1000 solicitudes de acceso a la base . Una solicitud de acceso a la base es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas**. Incluso si se envían varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por solicitud de acceso a la base.

Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.
Conexión a tierra con sus datos $2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025.

* Si un contexto de entrada de consulta tiene más de 200 000 tokens, todos los tokens (de entrada y de salida) se cobran a tarifas de contexto largo.
** La conexión a tierra con la Búsqueda de Google y la Conexión a Tierra Web para empresas se factura solo cuando una solicitud devuelve correctamente resultados web (es decir, resultados que contienen al menos una URL de soporte de conexión a tierra desde la web). Las tarifas de uso del modelo Gemini se aplican por separado.

Géminis 2.0

Gemini 2.0 se factura por tokens. Para calcular la cantidad de tokens de entrada en su solicitud antes de enviarla, puede usar el tokenizador del SDK o la API countTokens . Si su solicitud falla con un error 400 o 500, no se le cobrarán los tokens utilizados.

Utilice el interruptor en la tabla de precios para comparar los precios basados ​​en tokens y los precios basados ​​en modalidades.

Precios basados ​​en tokens

Modelo Tipo Precio Precio con API por lotes




Flash Géminis 2.0
1 millón de tokens de entrada $0.15 $0.075
1 millón de tokens de audio de entrada $1.00 $0.50
1 millón de tokens de texto de salida $0.60 $0.30
Ajuste para 1 millón de tokens de entrenamiento $3.00




Generación de imágenes Flash Gemini 2.0
1 millón de tokens de entrada $0.15
1 millón de tokens de audio de entrada $1.00
1 millón de tokens de vídeo de entrada $3
1 millón de tokens de texto de salida $0.60
1 millón de tokens de imagen de salida $30.00




API en vivo de Flash Gemini 2.0
1 millón de tokens de texto de entrada $0.5
1 millón de tokens de audio de entrada $3
1 millón de tokens de vídeo de entrada $3
1 millón de tokens de texto de salida $2
1 millón de tokens de audio de salida $12




Gemini 2.0 Flash Lite
1 millón de tokens de entrada $0.075 $0.0375
1 millón de tokens de audio de entrada $0.075 $0.0375
1 millón de tokens de texto de salida $0.30 $0.15
Ajuste para 1 millón de tokens de entrenamiento $1.00


Conexión a tierra con la Búsqueda de Google
Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1.500 indicaciones fundamentadas por día sin costo adicional.

Los avisos puestos a tierra que excedan esos límites se facturarán a $35 por cada 1000 avisos puestos a tierra .

Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos.

Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.

Puesta a tierra web para empresas
$45 por cada 1000 solicitudes de acceso a la base . Una solicitud de acceso a la base es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por solicitud de acceso a la base.

Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.
Conexión a tierra con sus datos $2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025.

Precios basados ​​en modalidades

Los precios de las modalidades que se indican a continuación se basan en casos de uso promedio, solo como referencia. La facturación real se basará únicamente en tokens:

  • 4 caracteres dan como resultado aproximadamente 1 token de texto, incluido el espacio en blanco.
  • Para una imagen de 1024x1024, se consumen 1290 tokens. El número de tokens por imagen varía según la resolución. Para más información sobre cómo calcular los tokens, consulte nuestra documentación .
  • La entrada de video consume 258 tokens por segundo a una frecuencia de muestreo de un fotograma por segundo. El video con audio factura tanto los tokens de video como los de audio.
  • La entrada de audio consume 25 tokens por segundo sin marca de tiempo.
Modelo Tipo Precio Precio con API por lotes




Flash Géminis 2.0
Texto de entrada ($/M char) $0.0375 $0.01875
Imagen de entrada ($/imagen) $0.0001935 $0.00009675
Vídeo de entrada ($/seg) $0.0000387 $0.00001935
Entrada de audio ($/seg) $0.000025 $0.0000125
Texto de salida ($/M char) $0.15 $0.075




Generación de imágenes Flash Gemini 2.0
Texto de entrada ($/M char) $0.0375
Imagen de entrada ($/imagen) $0.0001935
Vídeo de entrada ($/seg) $0.0000387
Entrada de audio ($/seg) $0.000025
Texto de salida ($/M char) $0.15
Imagen de salida imagen ($/imagen) $0.04





Gemini 2.0 Flash Lite
Texto de entrada ($/M char) $0.01875 $0.009375
Imagen de entrada ($/imagen) $0.00009675 $0.000048375
Vídeo de entrada ($/seg) $0.00001935 $0.000009675
Entrada de audio ($/seg) $0.000001875 $0.000000938
Texto de salida ($/M char) $0.075 $0.0375


Conexión a tierra con la Búsqueda de Google
Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1.500 indicaciones fundamentadas por día sin costo adicional.

Los avisos puestos a tierra que excedan esos límites se facturarán a $35 por cada 1000 avisos puestos a tierra .

Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos.

Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.

Puesta a tierra web para empresas
$45 por cada 1000 solicitudes de acceso a la base . Una solicitud de acceso a la base es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por solicitud de acceso a la base.

Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.

* Los precios están expresados ​​en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
* Los tokens de entrenamiento se calculan mediante la cantidad total de tokens en su conjunto de datos de entrenamiento, multiplicado por la cantidad de épocas.
* Los archivos PDF se facturan como entrada de imagen, y una página PDF equivale a una imagen.
* El punto final del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google y la Conexión a Tierra Web para empresas se factura solo cuando una solicitud devuelve correctamente resultados web (es decir, resultados que contienen al menos una URL de soporte de conexión a tierra desde la web). Las tarifas de uso del modelo Gemini se aplican por separado.
* API Gemini 2.0 Flash Live: 25 tokens por segundo de audio (entrada/salida), 258 tokens por segundo de vídeo (entrada). La conexión a tierra con la Búsqueda de Google sigue siendo gratuita mientras la API Gemini 2.0 Flash Live esté en versión preliminar.

Precios del Optimizador de modelos Vertex AI (experimental)*

Vertex AI Model Optimizer simplifica el uso de Gemini para clientes empresariales al proporcionar un único metapunto final para las solicitudes de modelos de Gemini. Los clientes que utilizan este servicio no tienen que especificar si usan Flash, Pro o una versión específica. Simplemente proporcionan una configuración (costo, calidad o equilibrio) para indicar sus preferencias, y Model Optimizer aplica el nivel de inteligencia adecuado para la tarea, enviando cada consulta al modelo más adecuado.

Vertex AI Model Optimizer aplica precios dinámicos. Esto significa que el precio promedio por token depende del nivel de inteligencia del modelo aplicado para completar la tarea. Por ello, a continuación se ofrecen ejemplos de precios para ilustrar posibles escenarios según su configuración (consulte las tablas a continuación). Los SKU de Model Optimizer cuestan $1 y funcionan como una unidad de compra para su facturación. Se le facturará según el consumo después de usar los modelos.

Relación E/S 5:1 Ejemplo 1
bot de chat
NOTA: estos rangos no son garantías, los resultados individuales de cada cliente pueden variar.
Preferencia del cliente Tokens de entrada del cliente enviados a MO Tokens de salida del cliente enviados a MO Precio de entrada promedio por millón de tokens (rango alto) Precio de salida promedio por millón de tokens (rango alto) Precio de entrada promedio por millón de tokens (rango bajo) Precio de salida promedio por millón de tokens (rango bajo)
Costo 10.000.000 2.000.000 $0.63 $2.50 $0.16 $0.63
Equilibrado 10.000.000 2.000.000 $1.26 $5.00 $0.63 $2.50
Calidad 10.000.000 2.000.000 $1.89 $7.50 $1.26 $5.00
Relación E/S 1:20 Ejemplo 2 Generación de contenido
Preferencia del cliente Tokens de entrada del cliente enviados a MO Tokens de salida del cliente enviados a MO Precio de entrada promedio por millón de tokens (rango alto) Precio de salida promedio por millón de tokens (rango alto) Precio de entrada promedio por millón de tokens (rango bajo) Precio de salida promedio por millón de tokens (rango bajo)
Costo 1.000.000 20.000.000 $0.63 $2.50 $0.16 $0.63
Equilibrado 1.000.000 20.000.000 $1.26 $5.00 $0.63 $2.50
Calidad 1.000.000 20.000.000 $1.89 $7.50 $1.26 $5.00

* Model Optimizer es una oferta experimental paga y puede dirigir solicitudes a versiones experimentales de Gemini en Vertex.

Otros modelos de Gemini

Todos los modelos de Gemini, excepto Gemini 2.0, se facturan según modalidades como caracteres, imágenes y segundos de vídeo/audio. La entrada de texto se factura por cada 1000 caracteres de entrada (indicación) y por cada 1000 caracteres de salida (respuesta). Los caracteres se contabilizan mediante puntos de código UTF-8 y se excluyen los espacios en blanco, lo que resulta en aproximadamente 4 caracteres por token. Las solicitudes de predicción que generan respuestas filtradas se facturan solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 $) se redondean a un céntimo. La entrada multimedia se factura por imagen o por segundo (vídeo). Si su solicitud falla con un error 400 o 500, no se le cobrarán los tokens utilizados.

Modelo Característica Tipo Precio
(=< 128K tokens de entrada)
Precio
(> 128K tokens de entrada)
Géminis 1.5 Flash Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
$0.00002 / imagen
$0.00002 / segundo
$0.00001875 / 1k caracteres
$0.000002 / segundo
$0.00004 / imagen
$0.00004 / segundo
$0.0000375 / 1k caracteres
$0.000004 / segundo
Salida de texto $0.000075 / 1k caracteres $0.00015 / 1k caracteres
Sintonización* Token de entrenamiento $8/M tokens
Géminis 1.5 Pro Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
$0.00032875 / imagen
$0.00032875 / segundo
$0.0003125 / 1k caracteres
$0.00003125 / segundo
$0.0006575 / imagen
$0.0006575 / segundo
$0.000625 / 1k caracteres
$0.0000625 / segundo
Salida de texto $0.00125 / 1k caracteres $0.0025 / 1k caracteres
Sintonización* Token de entrenamiento $80/M tokens
Géminis 1.0 Pro Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
$0.0025 / imagen
$0.002/segundo
$0.000125 / 1k caracteres
Salida de texto $0.000375 / 1k caracteres
Conexión a tierra con la Búsqueda de Google Texto $35 por cada 1.000 indicaciones fundamentadas .

Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos.

Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.
Puesta a tierra web para empresas Texto $45 por cada 1.000 indicaciones fundamentadas .

Una solicitud con base en la web es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud con base en la web.

Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día.
Conexión a tierra con sus datos Texto $2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025.

* Los precios están expresados ​​en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
* Si un contexto de consulta tiene más de 128K, todos los tokens se cobran a tarifas de contexto largo.
*Los modelos Gemini están disponibles en modo lote con un 50% de descuento.
* Gemini 1.0 Pro solo admite ventanas de contexto de hasta 32 K.
* Los archivos PDF se facturan como entrada de imagen, y una página PDF equivale a una imagen.
* El punto final del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google y la Conexión a Tierra Web para empresas se factura solo cuando una solicitud devuelve correctamente resultados web (es decir, resultados que contienen al menos una URL de soporte de conexión a tierra desde la web). Las tarifas de uso del modelo Gemini se aplican por separado.

Imagen

Con Imagen en Vertex AI, puede generar imágenes nuevas y editar imágenes según las indicaciones de texto que proporcione, o editar solo partes de las imágenes utilizando un área de máscara que defina junto con una serie de otras capacidades.

Modelo Característica Descripción Aporte Producción Precio
Imagen 4 Ultra Generación de imágenes Generar una imagen Mensaje de texto Imagen $0,06 por imagen
Imagen 4 Generación de imágenes Generar una imagen Mensaje de texto Imagen $0.04 por imagen
Imagen 4 Fast Generación de imágenes Generar una imagen Mensaje de texto Imagen $0.02 por imagen
Imagen 3 Generación de imágenes Generar una imagen
Editar una imagen
Personalizar una imagen
Mensaje de texto Imagen $0.04 por imagen
Imagen 3 rápida Generación de imágenes Generar una imagen Mensaje de texto Imagen $0.02 por imagen
Imagen 2, Imagen Generación de imágenes Generar una imagen Mensaje de texto Imagen $0.020 por imagen
Edición de imágenes Editar una imagen usando el método de máscara libre o máscara Aviso de imagen/texto Imagen $0.020 por imagen
Ampliación de escala Aumentar la resolución de una imagen generada a 2k y 4k Imagen Imagen $0.003 por imagen
Sintonia FINA Habilitar un "sujeto" proporcionado por el usuario para utilizarlo en indicaciones de Imagen (entrenamiento de pocas tomas) Tema(s) con identificador de texto y 4-8 imágenes por tema Modelo afinado (después del entrenamiento con sujetos proporcionados por el usuario) $ por hora de nodo (precio de capacitación personalizada de Vertex AI)
Subtítulos visuales Generar un título de texto corto o largo para una imagen Imagen Título del texto $0.0015/image
Preguntas y respuestas visuales Proporcionar una respuesta basada en una pregunta que haga referencia a una imagen Aviso de imagen/texto Respuesta de texto $0.0015/image

Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .

Veo

Veo 2 crea videos de increíble calidad en una amplia gama de temas y estilos, brindando una mejor comprensión de la física del mundo real y los matices del movimiento y la expresión humana.

Modelo Característica Descripción Aporte Producción Precio
Veo 3 Generación de vídeo Generar vídeos a partir de un mensaje de texto o una imagen de referencia Aviso de texto/imagen Video $0,50/segundo
Veo 3 Generación de video + audio Genere un video con efectos de sonido/voz sincronizados a partir de un mensaje de texto o una imagen de referencia. Aviso de texto/imagen Vídeo + Audio $0,75/segundo
Veo 2 Generación de vídeo Generar vídeos a partir de un mensaje de texto o una imagen de referencia Aviso de texto/imagen Video $0,50/segundo
Veo 2 Controles avanzados Genere videos mediante interpolación de fotogramas iniciales y finales, amplíe los videos generados y aplique controles de cámara Mensaje de texto/imagen/vídeo Video $0,50/segundo

Liria

Lyria 2 ofrece generación de música instrumental de alta calidad que es ideal para composiciones sofisticadas y exploración creativa detallada donde un resultado matizado es clave.

Modelo Característica Descripción Aporte Producción Precio
Lyria 2 Generación musical Generar música a partir de un mensaje de texto Mensaje de texto Música $0,06 por 30 segundos

Comprenda los costos de integración de sus aplicaciones de IA

Modelo Tipo Región Precio por cada 1000 tokens de entrada
Incrustación de Géminis Aporte Global
  • Solicitudes en línea: $0.00015
  • Solicitudes por lotes: $0.00012
Producción Global
  • Solicitudes en línea: Sin costo
  • Solicitudes por lotes: Sin cargo
Modelo Tipo Región Precio por cada 1.000 caracteres
Incrustaciones de texto
(Excluyendo la incrustación de Gemini)
Aporte Global
  • Solicitudes en línea: $0.000025
  • Solicitudes por lotes: $0.00002
Producción Global
  • Solicitudes en línea: Sin costo
  • Solicitudes por lotes: Sin cargo
Modelo Característica Descripción Aporte Producción Precio
incrustación multimodal Incrustaciones para multimodal: texto Generar incrustaciones usando texto como entrada Texto Incrustaciones $0.0002 / 1k caracteres de entrada
Incrustaciones para multimodal: imagen Generar incrustaciones usando la imagen como entrada Imagen Incrustaciones $0.0001 / entrada de imagen
Incrustaciones para multimodal: Video Plus Vídeo Plus Video Incrustaciones (hasta 15 incrustaciones por minuto de vídeo) $0,0020 por segundo de vídeo
Incrustaciones para multimodal: estándar de vídeo Estándar de vídeo Video Incrustaciones (hasta 8 incrustaciones por minuto de vídeo) $0,0010 por segundo de vídeo
Incrustaciones para multimodal: video esencial Vídeo esencial Video Incrustaciones (hasta 4 incrustaciones por minuto de vídeo) $0,0005 por segundo de vídeo

Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .

Precios de finalización de código de Vertex AI

La IA generativa en Vertex AI cobra por cada 1000 caracteres de entrada (solicitud) y cada 1000 caracteres de salida (respuesta). Los caracteres se contabilizan mediante puntos de código UTF-8 y se excluyen los espacios en blanco. Durante la fase de vista previa, los cargos tienen un descuento del 100 %. Las solicitudes de predicción que generan respuestas filtradas se cobran solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 $) se redondean a un céntimo.

Modelo Tipo Región Precio por cada 1.000 caracteres
Codey para completar código Aporte Global
  • Solicitudes en línea: $0.00025
Producción Global
  • Solicitudes en línea: $0.0005

Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .

Traducción (Texto)

Utilice la API de Vertex AI y Translation LLM para traducir texto. Las traducciones LLM suelen ser más fluidas y con un sonido más humano que los modelos de traducción clásicos, pero su compatibilidad con otros idiomas es más limitada (Más información) .

Modelo Método Uso Precio por millón de caracteres
Maestría en Derecho Traducción del texto * El número de caracteres de entrada por mes

$10 por millón de caracteres *

El número de caracteres de salida por mes

$10 por millón de caracteres *

Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
* El precio es por carácter procesado por el modelo. Para más información sobre los caracteres contados, consulte Caracteres facturados.

Optimice los costos con el almacenamiento en caché de contexto de Vertex AI

Con el almacenamiento en caché de contexto, puede reducir el costo del procesamiento de tokens de entrada de Gemini en un 75% y la latencia de la generación de contenido al almacenar en caché la parte contextual de su texto o contenido multimedia de entrada en modelos de Gemini. El tiempo que los datos se almacenan en la caché, controlable por el usuario, determina los cargos por "Almacenamiento en caché de contexto". Al crear un contexto en caché, se cobrará a los usuarios el costo estándar de tokens de entrada. Las visitas a la caché de datos de entrada se cobran a una tarifa reducida, "Entrada en caché", en lugar del costo de entrada normal. El tamaño de los datos, tanto para el almacenamiento como para la entrada, se calcula de la misma manera que el precio de entrada de Gemini.

Modelos Gemini 2.5

Modelo Característica Tipo Precio (/1M tokens)
<= 200K tokens de entrada
Precio (/1M tokens)
> 200K tokens de entrada
Géminis 2.5 Pro Entrada en caché Entrada (texto, imagen, vídeo, audio) $0,31 (/1 millón de tokens) $0,625 (/1 millón de tokens)
Producción N / A N / A
Almacenamiento de caché de contexto Entrada (texto, imagen, vídeo, audio) $4.5 (/M Tok/hora) $4.5 (/M Tok/hora)
Géminis 2.5 Flash Entrada en caché Entrada (texto, imagen, vídeo, audio) $0.0375 (/1 millón de tokens) $0.0375 (/1 millón de tokens)
Producción N / A N / A
Almacenamiento de caché de contexto Entrada (texto, imagen, vídeo, audio) $1 (/M Tok/hora) $1 (/M Tok/hora)

Modelos Gemini 2.0

Precios basados ​​en tokens


Modelo

Tipo
Almacenamiento
(M tok-hora)
Precio




Flash Géminis 2.0
1 millón de tokens de entrada $1.00 $0.0375
1 millón de tokens de audio de entrada $1.00 $0.25
1 millón de tokens de texto de salida N / A N / A


Gemini 2.0 Flash Lite
1 millón de tokens de entrada $1.00 $0.01875
1 millón de tokens de audio de entrada $1.00 $0.01875
1 millón de tokens de texto de salida N / A N / A

Precios basados ​​en modalidades

Los precios de las modalidades que se indican a continuación se basan en casos de uso promedio, solo como referencia. La facturación real se basará únicamente en tokens:

  • 4 caracteres dan como resultado aproximadamente 1 token de texto, incluido el espacio en blanco.
  • Para una imagen de 1024x1024, se consumen 1290 tokens. El número de tokens por imagen varía según la resolución. Para más información sobre cómo calcular los tokens, consulte nuestra documentación .
  • La entrada de video consume 258 tokens por segundo a una frecuencia de muestreo de un fotograma por segundo. El video con audio factura tanto los tokens de video como los de audio.
  • La entrada de audio consume 25 tokens por segundo sin marca de tiempo.

Modelo

Tipo
Almacenamiento
(Modalidad-hora)

Precio




Flash Géminis 2.0
Texto de entrada ($/M char) $0.25 $0.009375
Imagen de entrada ($/imagen) $0.00129 $0.000048375
Vídeo de entrada ($/seg) $0.000258 $0.000009675
Entrada de audio ($/seg) $0.000025 $0.00000625
Texto de salida ($/M char) N / A N / A




Gemini 2.0 Flash Lite
Texto de entrada ($/M char) $0.25 $0.0046875
Imagen de entrada ($/imagen) $0.00129 $0.0000241875
Vídeo de entrada ($/seg) $0.000258 $0.000009675
Entrada de audio ($/seg) $0.000258 $0.0000048375
Texto de salida ($/M char) N / A N / A


Conexión a tierra con la Búsqueda de Google
Gemini 2.0 Flash incluye hasta 1500 solicitudes con garantía por día sin costo adicional. Solicitudes con garantía.
Los excedentes de 1.500 por día se facturan a $35 por cada 1.000 solicitudes (hasta 1 millón de solicitudes por día).

Comuníquese con su equipo de cuentas si necesita más de 1 millón de solicitudes por día.

Puesta a tierra web para empresas
$45 por cada 1000 solicitudes (hasta 1 millón de solicitudes por día) a partir del 5 de mayo de 2025.

Comuníquese con su equipo de cuentas si necesita más de 1 millón de solicitudes por día.

* Los precios están expresados ​​en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
* Los archivos PDF se facturan como entrada de imagen, y una página PDF equivale a una imagen.
* El punto final del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google se factura solo para solicitudes que devuelvan resultados que contengan al menos una URL de soporte de conexión a tierra desde la web. También se aplican las tarifas de uso del modelo estándar de Gemini.

Rendimiento aprovisionado

El rendimiento aprovisionado garantiza el rendimiento para sus necesidades de IA generativa y se gestiona mediante unidades de escala de IA generativa (GSU). Obtenga más información sobre el rendimiento que proporciona cada GSU aquí y utilice nuestro estimador en línea aquí .

Duración Precio por GSU Por
Compromiso de 1 semana $1,200 Semana
Compromiso de 1 mes $2,700 Mes
Compromiso de 3 meses $2,400 Mes
Compromiso de 1 año $2,000 Mes

Ejemplo de cálculo de costes

Un usuario debe asegurarse de que puede soportar 10 consultas por segundo (QPS) de una consulta con una entrada de 1000 tokens de texto y 500 tokens de audio y recibir una salida de 300 tokens de texto utilizando gemini-2.0-flash.

Usando la tabla de rendimiento y tasa de evolución, para gemini-2.0-flash sabemos que la tasa de evolución de un token de texto de entrada es de 1 token, la tasa de evolución de un token de audio de entrada es de 7 tokens y la tasa de evolución de un token de texto de salida es de 4 tokens.

El total de tokens de entrada del usuario es de 1000* (1 token por cada token de texto de entrada) + 500* (7 tokens por cada token de audio de entrada) = 4500 tokens de entrada ajustados a la evolución. El total de tokens de salida del usuario es de 300* (4 tokens por cada token de texto de salida) = 1200 tokens de salida ajustados a la evolución. Al sumarlos, obtenemos 4500 tokens de entrada ajustados a la evolución + 1200 tokens de salida ajustados a la evolución = 5700 tokens en total por consulta.

Al multiplicar el total de tokens por consulta por QPS, obtenemos 5700 tokens totales por consulta * 10 QPS = 57 000 tokens totales por segundo.

Dividiendo esto entre el rendimiento total por segundo por GSU, obtenemos 57 000 tokens por segundo ÷ 3360 de rendimiento por segundo por GSU = 16,96 GSU. El incremento mínimo de compra de GSU para este modelo es de 1, por lo que el usuario necesitaría 17 GSU.

Si el usuario quisiera mantener este rendimiento durante una semana, el costo sería de $1200 * 17 GSU = $20 400 semanales. Si quisiera mantener este rendimiento durante un mes, el costo sería de $2700 * 17 GSU = $45 900 mensuales. Si quisiera mantener este rendimiento durante tres meses, el costo sería de $2400 * 17 GSU = $40 800 mensuales. Y, por último, si quisiera mantener este rendimiento durante un año, el costo sería de $2000 * 17 GSU = $34 000 mensuales.

Compare precios de modelos de socios en Vertex AI

Los modelos de socios son una lista seleccionada de modelos de IA generativa desarrollados por socios de Google. Se ofrecen como API administradas. Para obtener más información, consulte la sección "Descripción general de los modelos de socios ". En las siguientes secciones se detallan los precios de los modelos de socios de Google.

Modelos de AI21 Lab

Modelo Precios
Jamba 1.5 Grande Entrada: $2/millón de tokens
Salida: $8/millón de tokens
Jamba 1.5 Mini Entrada: $0,20/millón de tokens
Salida: $0,40/millón de tokens

Los modelos Claude de Anthropic

Modelo Precios
Claude Opus 4 Entrada: $15/millón de tokens
Salida: $75/millón de tokens

Entrada por lotes: $7,50/millón de tokens
Producción por lotes: $37,50/millón de tokens

Escritura en caché: $18,75/millón de tokens
Golpe de caché: $1,50/millón de tokens

Escritura de caché por lotes: $9,375/millón de tokens
Impacto de caché por lotes: $0,75/millón de tokens
Soneto 4 de Claude Entrada: $3/millón de tokens
Salida: $15/millón de tokens

Entrada por lotes: $1,50/millón de tokens
Producción por lotes: $7,50/millón de tokens

Escritura en caché: $3,75/millón de tokens
Impacto de caché: $0,30/millón de tokens

Escritura de caché por lotes: $1,875/millón de tokens
Impacto de caché por lotes: $0,15/millón de tokens
Soneto Claude 3.7 Entrada: $3/millón de tokens
Salida: $15/millón de tokens

Entrada por lotes: $1,50/millón de tokens
Producción por lotes: $7,50/millón de tokens

Escritura en caché: $3,75/millón de tokens
Impacto de caché: $0,30/millón de tokens

Escritura de caché por lotes: $1,875/millón de tokens
Impacto de caché por lotes: $0,15/millón de tokens
Haiku de Claude 3.5 Entrada: $0,80/millón de tokens
Salida: $4/millón de tokens

Entrada por lotes: $0,40/millón de tokens
Producción por lotes: $2/millón de tokens

Escritura en caché: $1/millón de tokens
Impacto de caché: $0,08/millón de tokens

Escritura de caché por lotes: $0,50/millón de tokens
Impacto de caché por lotes: $0,04/millón de tokens
Claude 3.5 Soneto v2 Entrada: $3/millón de tokens
Salida: $15/millón de tokens

Entrada por lotes: $1,50/millón de tokens
Producción por lotes: $7,50/millón de tokens

Escritura en caché: $3,75/millón de tokens
Impacto de caché: $0,30/millón de tokens

Escritura de caché por lotes: $1,875/millón de tokens
Impacto de caché por lotes: $0,15/millón de tokens
Soneto Claude 3.5 Entrada: $3/millón de tokens
Salida: $15/millón de tokens

Escritura en caché: $3,75/millón de tokens
Impacto de caché: $0,30/millón de tokens
Haiku de Claude 3 Entrada: $0,25/millón de tokens
Salida: $1,25/millón de tokens

Escritura en caché: $0,30/millón de tokens
Impacto de caché: $0,03/millón de tokens
Claude 3 Sonnet (deprecated) Entrada: $3/millón de tokens
Salida: $15/millón de tokens
Claude 3 Opus Entrada: $15/millón de tokens
Salida: $75/millón de tokens

Escritura en caché: $18,75/millón de tokens
Golpe de caché: $1,50/millón de tokens

Modelos de llama de Meta

Modelo Precios
Llama 3.1 405B Entrada: $5.00 / millón de tokens
Salida: $16,00/millón de tokens
Llama 3.3 70B * Entrada: $0,72/millón de tokens
Salida: $0,72/millón de tokens
Llama 4 Scout * Entrada: $0,25/millón de tokens
Salida: $0,70/millón de tokens
Llama 4 Maverick * Entrada: $0,35/millón de tokens
Salida: $1,15/millón de tokens
  • Disponible sin cargo hasta el 1 de mayo de 2025.

Modelos de Mistral AI

Modelo Precios
Mistral OCR (25.05) Entrada: $0,0005/millón de tokens (o $0,0005/página)
Salida: $0,0005/millón de tokens (o $0,0005/página)
Mistral Pequeño 3.1 (25.03) Entrada: $0,10/millón de tokens
Salida: $0,30/millón de tokens
Mistral Grande (24.11) Entrada: $2.00 / millón de tokens
Salida: $6,00/millón de tokens
Mistral Nemo Entrada: $0,15/millón de tokens
Salida: $0,15/millón de tokens
Codestral (25.01) Entrada: $0,30/millón de tokens
Salida: $0,90/millón de tokens

Solicitar una cotización personalizada

Con el plan de pago por uso de Google Cloud, solo pagas por los servicios que usas. Contacta con nuestro equipo de ventas para obtener un presupuesto personalizado para tu organización.
Contactar con ventas