Costo de construcción e implementación de modelos de IA en Vertex AI
Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
Solo se le cobrará por las solicitudes que devuelvan un código de respuesta 200. Las solicitudes que devuelvan cualquier otro código de respuesta, como los códigos 4xx y 5xx, no se cobrarán por la entrada ni la salida.
Esta página describe los precios de la IA Generativa en Vertex AI. Para conocer los demás precios de Vertex AI, incluyendo la Plataforma de Aprendizaje Automático y los servicios MLOps, consulte la página de precios de Vertex AI .
Modelos de Google
Géminis 2.5
Modelo | Tipo | Precio (/1M tokens) <= 200K tokens de entrada | Precio (/1M tokens) > 200K tokens de entrada | Precio (/1M tokens) <= 200K tokens de entrada con API por lotes | Precio (/1M tokens) > 200K tokens de entrada con API por lotes |
---|---|---|---|---|---|
Géminis 2.5 Pro | |||||
Entrada (texto, imagen, vídeo, audio) | $1.25 | $2.5 | $0.625 | $1.25 | |
Salida de texto (respuesta y razonamiento) | $10 | $15 | $5 | $7.5 | |
Géminis 2.5 Flash GA | |||||
Entrada (texto, imagen, vídeo) | $0.30 | $0.30 | $0.15 | $0.15 | |
Entrada de audio | $1 | $1 | $0.5 | $0.5 | |
Salida de texto | $2.50 | $2.50 | $1.25 | $1.25 | |
Ajuste para 1 millón de tokens de entrenamiento | $5.00 | N / A | N / A | N / A | Vista previa de Flash de Gemini 2.5 (Puntos finales retirados el 15/07/2025) |
Entrada (texto, imagen, vídeo) | $0.15 | $0.15 | $0.075 | $0.075 | |
Entrada de audio | $1 | $1 | $0.5 | $0.5 | |
Salida de texto (sin pensar) | $0.60 | $0.60 | $0.30 | $0.30 | |
Salida de texto (pensamiento-respuesta y razonamiento) | $3.50 | $3.50 | $1.75 | $1.75 | |
API en vivo de Flash Gemini 2.5 | |||||
1 millón de tokens de texto de entrada | $0.5 | $0.5 | N / A | N / A | |
1 millón de tokens de audio de entrada | $3 | $3 | N / A | N / A | |
1 millón de tokens de vídeo de entrada | $3 | $3 | N / A | N / A | |
1 millón de tokens de texto de salida | $2 | $2 | N / A | N / A | |
1 millón de tokens de audio de salida | $12 | $12 | N / A | N / A | |
Gemini 2.5 Flash Lite | |||||
Entrada (texto, imagen, vídeo) | $0.1 | $0.1 | N / A | N / A | |
Entrada de audio | $0.5 | $0.5 | N / A | N / A | |
Salida de texto (respuesta y razonamiento) | $0.4 | $0.4 | N / A | N / A | |
Conexión a tierra con la Búsqueda de Google | Gemini 2.0 Flash , 2.5 Flash y 2.5 Flash-Lite incluyen un total de 1500 indicaciones de conexión a tierra al día sin costo adicional. Gemini 2.5 Pro incluye 10 000 indicaciones de conexión a tierra al día sin costo adicional. Los avisos puestos a tierra que excedan esos límites se facturarán a $35 por cada 1000 avisos puestos a tierra . Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google**. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día. | ||||
Puesta a tierra web para empresas | $45 por cada 1000 solicitudes de acceso a la base . Una solicitud de acceso a la base es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas**. Incluso si se envían varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por solicitud de acceso a la base. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día. | ||||
Conexión a tierra con sus datos | $2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025. |
* Si un contexto de entrada de consulta tiene más de 200 000 tokens, todos los tokens (de entrada y de salida) se cobran a tarifas de contexto largo.
** La conexión a tierra con la Búsqueda de Google y la Conexión a Tierra Web para empresas se factura solo cuando una solicitud devuelve correctamente resultados web (es decir, resultados que contienen al menos una URL de soporte de conexión a tierra desde la web). Las tarifas de uso del modelo Gemini se aplican por separado.
Géminis 2.0
Gemini 2.0 se factura por tokens. Para calcular la cantidad de tokens de entrada en su solicitud antes de enviarla, puede usar el tokenizador del SDK o la API countTokens . Si su solicitud falla con un error 400 o 500, no se le cobrarán los tokens utilizados.
Utilice el interruptor en la tabla de precios para comparar los precios basados en tokens y los precios basados en modalidades.
Precios basados en tokens
Modelo | Tipo | Precio | Precio con API por lotes |
---|---|---|---|
Flash Géminis 2.0 | |||
1 millón de tokens de entrada | $0.15 | $0.075 | |
1 millón de tokens de audio de entrada | $1.00 | $0.50 | |
1 millón de tokens de texto de salida | $0.60 | $0.30 | |
Ajuste para 1 millón de tokens de entrenamiento | $3.00 | ||
Generación de imágenes Flash Gemini 2.0 | |||
1 millón de tokens de entrada | $0.15 | ||
1 millón de tokens de audio de entrada | $1.00 | ||
1 millón de tokens de vídeo de entrada | $3 | ||
1 millón de tokens de texto de salida | $0.60 | ||
1 millón de tokens de imagen de salida | $30.00 | ||
API en vivo de Flash Gemini 2.0 | |||
1 millón de tokens de texto de entrada | $0.5 | ||
1 millón de tokens de audio de entrada | $3 | ||
1 millón de tokens de vídeo de entrada | $3 | ||
1 millón de tokens de texto de salida | $2 | ||
1 millón de tokens de audio de salida | $12 | ||
Gemini 2.0 Flash Lite | |||
1 millón de tokens de entrada | $0.075 | $0.0375 | |
1 millón de tokens de audio de entrada | $0.075 | $0.0375 | |
1 millón de tokens de texto de salida | $0.30 | $0.15 | |
Ajuste para 1 millón de tokens de entrenamiento | $1.00 | ||
Conexión a tierra con la Búsqueda de Google | Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1.500 indicaciones fundamentadas por día sin costo adicional. Los avisos puestos a tierra que excedan esos límites se facturarán a $35 por cada 1000 avisos puestos a tierra . Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día. | ||
Puesta a tierra web para empresas | $45 por cada 1000 solicitudes de acceso a la base . Una solicitud de acceso a la base es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por solicitud de acceso a la base. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día. | ||
Conexión a tierra con sus datos | $2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025. |
Precios basados en modalidades
Los precios de las modalidades que se indican a continuación se basan en casos de uso promedio, solo como referencia. La facturación real se basará únicamente en tokens:
- 4 caracteres dan como resultado aproximadamente 1 token de texto, incluido el espacio en blanco.
- Para una imagen de 1024x1024, se consumen 1290 tokens. El número de tokens por imagen varía según la resolución. Para más información sobre cómo calcular los tokens, consulte nuestra documentación .
- La entrada de video consume 258 tokens por segundo a una frecuencia de muestreo de un fotograma por segundo. El video con audio factura tanto los tokens de video como los de audio.
- La entrada de audio consume 25 tokens por segundo sin marca de tiempo.
Modelo | Tipo | Precio | Precio con API por lotes |
---|---|---|---|
Flash Géminis 2.0 | |||
Texto de entrada ($/M char) | $0.0375 | $0.01875 | |
Imagen de entrada ($/imagen) | $0.0001935 | $0.00009675 | |
Vídeo de entrada ($/seg) | $0.0000387 | $0.00001935 | |
Entrada de audio ($/seg) | $0.000025 | $0.0000125 | |
Texto de salida ($/M char) | $0.15 | $0.075 | |
Generación de imágenes Flash Gemini 2.0 | |||
Texto de entrada ($/M char) | $0.0375 | ||
Imagen de entrada ($/imagen) | $0.0001935 | ||
Vídeo de entrada ($/seg) | $0.0000387 | ||
Entrada de audio ($/seg) | $0.000025 | ||
Texto de salida ($/M char) | $0.15 | ||
Imagen de salida imagen ($/imagen) | $0.04 | ||
Gemini 2.0 Flash Lite | |||
Texto de entrada ($/M char) | $0.01875 | $0.009375 | |
Imagen de entrada ($/imagen) | $0.00009675 | $0.000048375 | |
Vídeo de entrada ($/seg) | $0.00001935 | $0.000009675 | |
Entrada de audio ($/seg) | $0.000001875 | $0.000000938 | |
Texto de salida ($/M char) | $0.075 | $0.0375 | |
Conexión a tierra con la Búsqueda de Google | Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1.500 indicaciones fundamentadas por día sin costo adicional. Los avisos puestos a tierra que excedan esos límites se facturarán a $35 por cada 1000 avisos puestos a tierra . Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día. | ||
Puesta a tierra web para empresas | $45 por cada 1000 solicitudes de acceso a la base . Una solicitud de acceso a la base es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por solicitud de acceso a la base. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día. |
* Los precios están expresados en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
* Los tokens de entrenamiento se calculan mediante la cantidad total de tokens en su conjunto de datos de entrenamiento, multiplicado por la cantidad de épocas.
* Los archivos PDF se facturan como entrada de imagen, y una página PDF equivale a una imagen.
* El punto final del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google y la Conexión a Tierra Web para empresas se factura solo cuando una solicitud devuelve correctamente resultados web (es decir, resultados que contienen al menos una URL de soporte de conexión a tierra desde la web). Las tarifas de uso del modelo Gemini se aplican por separado.
* API Gemini 2.0 Flash Live: 25 tokens por segundo de audio (entrada/salida), 258 tokens por segundo de vídeo (entrada). La conexión a tierra con la Búsqueda de Google sigue siendo gratuita mientras la API Gemini 2.0 Flash Live esté en versión preliminar.
Precios del Optimizador de modelos Vertex AI (experimental)*
Vertex AI Model Optimizer simplifica el uso de Gemini para clientes empresariales al proporcionar un único metapunto final para las solicitudes de modelos de Gemini. Los clientes que utilizan este servicio no tienen que especificar si usan Flash, Pro o una versión específica. Simplemente proporcionan una configuración (costo, calidad o equilibrio) para indicar sus preferencias, y Model Optimizer aplica el nivel de inteligencia adecuado para la tarea, enviando cada consulta al modelo más adecuado.
Vertex AI Model Optimizer aplica precios dinámicos. Esto significa que el precio promedio por token depende del nivel de inteligencia del modelo aplicado para completar la tarea. Por ello, a continuación se ofrecen ejemplos de precios para ilustrar posibles escenarios según su configuración (consulte las tablas a continuación). Los SKU de Model Optimizer cuestan $1 y funcionan como una unidad de compra para su facturación. Se le facturará según el consumo después de usar los modelos.
Relación E/S 5:1 | Ejemplo 1 bot de chat | NOTA: estos rangos no son garantías, los resultados individuales de cada cliente pueden variar. | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Preferencia del cliente | Tokens de entrada del cliente enviados a MO | Tokens de salida del cliente enviados a MO | Precio de entrada promedio por millón de tokens (rango alto) | Precio de salida promedio por millón de tokens (rango alto) | Precio de entrada promedio por millón de tokens (rango bajo) | Precio de salida promedio por millón de tokens (rango bajo) | |||||
Costo | 10.000.000 | 2.000.000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
Equilibrado | 10.000.000 | 2.000.000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
Calidad | 10.000.000 | 2.000.000 | $1.89 | $7.50 | $1.26 | $5.00 |
Relación E/S 1:20 | Ejemplo 2 Generación de contenido | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Preferencia del cliente | Tokens de entrada del cliente enviados a MO | Tokens de salida del cliente enviados a MO | Precio de entrada promedio por millón de tokens (rango alto) | Precio de salida promedio por millón de tokens (rango alto) | Precio de entrada promedio por millón de tokens (rango bajo) | Precio de salida promedio por millón de tokens (rango bajo) | |||||
Costo | 1.000.000 | 20.000.000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
Equilibrado | 1.000.000 | 20.000.000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
Calidad | 1.000.000 | 20.000.000 | $1.89 | $7.50 | $1.26 | $5.00 |
Otros modelos de Gemini
Todos los modelos de Gemini, excepto Gemini 2.0, se facturan según modalidades como caracteres, imágenes y segundos de vídeo/audio. La entrada de texto se factura por cada 1000 caracteres de entrada (indicación) y por cada 1000 caracteres de salida (respuesta). Los caracteres se contabilizan mediante puntos de código UTF-8 y se excluyen los espacios en blanco, lo que resulta en aproximadamente 4 caracteres por token. Las solicitudes de predicción que generan respuestas filtradas se facturan solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 $) se redondean a un céntimo. La entrada multimedia se factura por imagen o por segundo (vídeo). Si su solicitud falla con un error 400 o 500, no se le cobrarán los tokens utilizados.
Modelo | Característica | Tipo | Precio (=< 128K tokens de entrada) | Precio (> 128K tokens de entrada) | ||
---|---|---|---|---|---|---|
Géminis 1.5 Flash | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio | $0.00002 / imagen $0.00002 / segundo $0.00001875 / 1k caracteres $0.000002 / segundo | $0.00004 / imagen $0.00004 / segundo $0.0000375 / 1k caracteres $0.000004 / segundo | ||
Salida de texto | $0.000075 / 1k caracteres | $0.00015 / 1k caracteres | ||||
Sintonización* | Token de entrenamiento | $8/M tokens | ||||
Géminis 1.5 Pro | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio | $0.00032875 / imagen $0.00032875 / segundo $0.0003125 / 1k caracteres $0.00003125 / segundo | $0.0006575 / imagen $0.0006575 / segundo $0.000625 / 1k caracteres $0.0000625 / segundo | ||
Salida de texto | $0.00125 / 1k caracteres | $0.0025 / 1k caracteres | ||||
Sintonización* | Token de entrenamiento | $80/M tokens | ||||
Géminis 1.0 Pro | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto | $0.0025 / imagen $0.002/segundo $0.000125 / 1k caracteres | |||
Salida de texto | $0.000375 / 1k caracteres | |||||
Conexión a tierra con la Búsqueda de Google | Texto | $35 por cada 1.000 indicaciones fundamentadas . Una solicitud basada en datos es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud basada en datos. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día. | ||||
Puesta a tierra web para empresas | Texto | $45 por cada 1.000 indicaciones fundamentadas . Una solicitud con base en la web es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding para empresas*. Incluso si se envían varias consultas a la Búsqueda de Google, solo se cobra una vez por solicitud con base en la web. Comuníquese con su equipo de cuentas si necesita más de 1 millón de indicaciones fundamentadas por día. | ||||
Conexión a tierra con sus datos | Texto | $2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025. |
* Los precios están expresados en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
* Si un contexto de consulta tiene más de 128K, todos los tokens se cobran a tarifas de contexto largo.
*Los modelos Gemini están disponibles en modo lote con un 50% de descuento.
* Gemini 1.0 Pro solo admite ventanas de contexto de hasta 32 K.
* Los archivos PDF se facturan como entrada de imagen, y una página PDF equivale a una imagen.
* El punto final del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google y la Conexión a Tierra Web para empresas se factura solo cuando una solicitud devuelve correctamente resultados web (es decir, resultados que contienen al menos una URL de soporte de conexión a tierra desde la web). Las tarifas de uso del modelo Gemini se aplican por separado.
Imagen
Con Imagen en Vertex AI, puede generar imágenes nuevas y editar imágenes según las indicaciones de texto que proporcione, o editar solo partes de las imágenes utilizando un área de máscara que defina junto con una serie de otras capacidades.
Modelo | Característica | Descripción | Aporte | Producción | Precio |
---|---|---|---|---|---|
Imagen 4 Ultra | Generación de imágenes | Generar una imagen | Mensaje de texto | Imagen | $0,06 por imagen |
Imagen 4 | Generación de imágenes | Generar una imagen | Mensaje de texto | Imagen | $0.04 por imagen |
Imagen 4 Fast | Generación de imágenes | Generar una imagen | Mensaje de texto | Imagen | $0.02 por imagen |
Imagen 3 | Generación de imágenes | Generar una imagen Editar una imagen Personalizar una imagen | Mensaje de texto | Imagen | $0.04 por imagen |
Imagen 3 rápida | Generación de imágenes | Generar una imagen | Mensaje de texto | Imagen | $0.02 por imagen |
Imagen 2, Imagen | Generación de imágenes | Generar una imagen | Mensaje de texto | Imagen | $0.020 por imagen |
Edición de imágenes | Editar una imagen usando el método de máscara libre o máscara | Aviso de imagen/texto | Imagen | $0.020 por imagen | |
Ampliación de escala | Aumentar la resolución de una imagen generada a 2k y 4k | Imagen | Imagen | $0.003 por imagen | |
Sintonia FINA | Habilitar un "sujeto" proporcionado por el usuario para utilizarlo en indicaciones de Imagen (entrenamiento de pocas tomas) | Tema(s) con identificador de texto y 4-8 imágenes por tema | Modelo afinado (después del entrenamiento con sujetos proporcionados por el usuario) | $ por hora de nodo (precio de capacitación personalizada de Vertex AI) | |
Subtítulos visuales | Generar un título de texto corto o largo para una imagen | Imagen | Título del texto | $0.0015/image | |
Preguntas y respuestas visuales | Proporcionar una respuesta basada en una pregunta que haga referencia a una imagen | Aviso de imagen/texto | Respuesta de texto | $0.0015/image |
Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
Veo
Veo 2 crea videos de increíble calidad en una amplia gama de temas y estilos, brindando una mejor comprensión de la física del mundo real y los matices del movimiento y la expresión humana.
Modelo | Característica | Descripción | Aporte | Producción | Precio |
---|---|---|---|---|---|
Veo 3 | Generación de vídeo | Generar vídeos a partir de un mensaje de texto o una imagen de referencia | Aviso de texto/imagen | Video | $0,50/segundo |
Veo 3 | Generación de video + audio | Genere un video con efectos de sonido/voz sincronizados a partir de un mensaje de texto o una imagen de referencia. | Aviso de texto/imagen | Vídeo + Audio | $0,75/segundo |
Veo 2 | Generación de vídeo | Generar vídeos a partir de un mensaje de texto o una imagen de referencia | Aviso de texto/imagen | Video | $0,50/segundo |
Veo 2 | Controles avanzados | Genere videos mediante interpolación de fotogramas iniciales y finales, amplíe los videos generados y aplique controles de cámara | Mensaje de texto/imagen/vídeo | Video | $0,50/segundo |
Liria
Lyria 2 ofrece generación de música instrumental de alta calidad que es ideal para composiciones sofisticadas y exploración creativa detallada donde un resultado matizado es clave.
Modelo | Característica | Descripción | Aporte | Producción | Precio |
---|---|---|---|---|---|
Lyria 2 | Generación musical | Generar música a partir de un mensaje de texto | Mensaje de texto | Música | $0,06 por 30 segundos |
Comprenda los costos de integración de sus aplicaciones de IA
Modelo | Tipo | Región | Precio por cada 1000 tokens de entrada |
---|---|---|---|
Incrustación de Géminis | Aporte | Global |
|
Producción | Global |
|
Modelo | Tipo | Región | Precio por cada 1.000 caracteres |
---|---|---|---|
Incrustaciones de texto (Excluyendo la incrustación de Gemini) | Aporte | Global |
|
Producción | Global |
|
Modelo | Característica | Descripción | Aporte | Producción | Precio |
---|---|---|---|---|---|
incrustación multimodal | Incrustaciones para multimodal: texto | Generar incrustaciones usando texto como entrada | Texto | Incrustaciones | $0.0002 / 1k caracteres de entrada |
Incrustaciones para multimodal: imagen | Generar incrustaciones usando la imagen como entrada | Imagen | Incrustaciones | $0.0001 / entrada de imagen | |
Incrustaciones para multimodal: Video Plus | Vídeo Plus | Video | Incrustaciones (hasta 15 incrustaciones por minuto de vídeo) | $0,0020 por segundo de vídeo | |
Incrustaciones para multimodal: estándar de vídeo | Estándar de vídeo | Video | Incrustaciones (hasta 8 incrustaciones por minuto de vídeo) | $0,0010 por segundo de vídeo | |
Incrustaciones para multimodal: video esencial | Vídeo esencial | Video | Incrustaciones (hasta 4 incrustaciones por minuto de vídeo) | $0,0005 por segundo de vídeo |
Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
Precios de finalización de código de Vertex AI
La IA generativa en Vertex AI cobra por cada 1000 caracteres de entrada (solicitud) y cada 1000 caracteres de salida (respuesta). Los caracteres se contabilizan mediante puntos de código UTF-8 y se excluyen los espacios en blanco. Durante la fase de vista previa, los cargos tienen un descuento del 100 %. Las solicitudes de predicción que generan respuestas filtradas se cobran solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 $) se redondean a un céntimo.
Modelo | Tipo | Región | Precio por cada 1.000 caracteres |
---|---|---|---|
Codey para completar código | Aporte | Global |
|
Producción | Global |
|
Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
Traducción (Texto)
Utilice la API de Vertex AI y Translation LLM para traducir texto. Las traducciones LLM suelen ser más fluidas y con un sonido más humano que los modelos de traducción clásicos, pero su compatibilidad con otros idiomas es más limitada (Más información) .
Modelo | Método | Uso | Precio por millón de caracteres |
---|---|---|---|
Maestría en Derecho | Traducción del texto * | El número de caracteres de entrada por mes | $10 por millón de caracteres * |
El número de caracteres de salida por mes | $10 por millón de caracteres * |
Los precios se muestran en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform . * El precio es por carácter procesado por el modelo. Para más información sobre los caracteres contados, consulte Caracteres facturados.
Optimice los costos con el almacenamiento en caché de contexto de Vertex AI
Con el almacenamiento en caché de contexto, puede reducir el costo del procesamiento de tokens de entrada de Gemini en un 75% y la latencia de la generación de contenido al almacenar en caché la parte contextual de su texto o contenido multimedia de entrada en modelos de Gemini. El tiempo que los datos se almacenan en la caché, controlable por el usuario, determina los cargos por "Almacenamiento en caché de contexto". Al crear un contexto en caché, se cobrará a los usuarios el costo estándar de tokens de entrada. Las visitas a la caché de datos de entrada se cobran a una tarifa reducida, "Entrada en caché", en lugar del costo de entrada normal. El tamaño de los datos, tanto para el almacenamiento como para la entrada, se calcula de la misma manera que el precio de entrada de Gemini.
Modelos Gemini 2.5
Modelo | Característica | Tipo | Precio (/1M tokens) <= 200K tokens de entrada | Precio (/1M tokens) > 200K tokens de entrada |
---|---|---|---|---|
Géminis 2.5 Pro | Entrada en caché | Entrada (texto, imagen, vídeo, audio) | $0,31 (/1 millón de tokens) | $0,625 (/1 millón de tokens) |
Producción | N / A | N / A | ||
Almacenamiento de caché de contexto | Entrada (texto, imagen, vídeo, audio) | $4.5 (/M Tok/hora) | $4.5 (/M Tok/hora) | |
Géminis 2.5 Flash | Entrada en caché | Entrada (texto, imagen, vídeo, audio) | $0.0375 (/1 millón de tokens) | $0.0375 (/1 millón de tokens) |
Producción | N / A | N / A | ||
Almacenamiento de caché de contexto | Entrada (texto, imagen, vídeo, audio) | $1 (/M Tok/hora) | $1 (/M Tok/hora) |
Modelos Gemini 2.0
Precios basados en tokens
Modelo | Tipo | Almacenamiento (M tok-hora) | Precio |
---|---|---|---|
Flash Géminis 2.0 | |||
1 millón de tokens de entrada | $1.00 | $0.0375 | |
1 millón de tokens de audio de entrada | $1.00 | $0.25 | |
1 millón de tokens de texto de salida | N / A | N / A | |
Gemini 2.0 Flash Lite | |||
1 millón de tokens de entrada | $1.00 | $0.01875 | |
1 millón de tokens de audio de entrada | $1.00 | $0.01875 | |
1 millón de tokens de texto de salida | N / A | N / A |
Precios basados en modalidades
Los precios de las modalidades que se indican a continuación se basan en casos de uso promedio, solo como referencia. La facturación real se basará únicamente en tokens:
- 4 caracteres dan como resultado aproximadamente 1 token de texto, incluido el espacio en blanco.
- Para una imagen de 1024x1024, se consumen 1290 tokens. El número de tokens por imagen varía según la resolución. Para más información sobre cómo calcular los tokens, consulte nuestra documentación .
- La entrada de video consume 258 tokens por segundo a una frecuencia de muestreo de un fotograma por segundo. El video con audio factura tanto los tokens de video como los de audio.
- La entrada de audio consume 25 tokens por segundo sin marca de tiempo.
Modelo | Tipo | Almacenamiento (Modalidad-hora) | Precio |
---|---|---|---|
Flash Géminis 2.0 | |||
Texto de entrada ($/M char) | $0.25 | $0.009375 | |
Imagen de entrada ($/imagen) | $0.00129 | $0.000048375 | |
Vídeo de entrada ($/seg) | $0.000258 | $0.000009675 | |
Entrada de audio ($/seg) | $0.000025 | $0.00000625 | |
Texto de salida ($/M char) | N / A | N / A | |
Gemini 2.0 Flash Lite | |||
Texto de entrada ($/M char) | $0.25 | $0.0046875 | |
Imagen de entrada ($/imagen) | $0.00129 | $0.0000241875 | |
Vídeo de entrada ($/seg) | $0.000258 | $0.000009675 | |
Entrada de audio ($/seg) | $0.000258 | $0.0000048375 | |
Texto de salida ($/M char) | N / A | N / A | |
Conexión a tierra con la Búsqueda de Google | Gemini 2.0 Flash incluye hasta 1500 solicitudes con garantía por día sin costo adicional. Solicitudes con garantía. Los excedentes de 1.500 por día se facturan a $35 por cada 1.000 solicitudes (hasta 1 millón de solicitudes por día). Comuníquese con su equipo de cuentas si necesita más de 1 millón de solicitudes por día. | ||
Puesta a tierra web para empresas | $45 por cada 1000 solicitudes (hasta 1 millón de solicitudes por día) a partir del 5 de mayo de 2025. Comuníquese con su equipo de cuentas si necesita más de 1 millón de solicitudes por día. |
* Los precios están expresados en dólares estadounidenses (USD). Si paga en una moneda distinta al USD, se aplicarán los precios indicados en su moneda en los SKU de Cloud Platform .
* Los archivos PDF se facturan como entrada de imagen, y una página PDF equivale a una imagen.
* El punto final del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La conexión a tierra con la Búsqueda de Google se factura solo para solicitudes que devuelvan resultados que contengan al menos una URL de soporte de conexión a tierra desde la web. También se aplican las tarifas de uso del modelo estándar de Gemini.
Rendimiento aprovisionado
El rendimiento aprovisionado garantiza el rendimiento para sus necesidades de IA generativa y se gestiona mediante unidades de escala de IA generativa (GSU). Obtenga más información sobre el rendimiento que proporciona cada GSU aquí y utilice nuestro estimador en línea aquí .
Duración | Precio por GSU | Por |
---|---|---|
Compromiso de 1 semana | $1,200 | Semana |
Compromiso de 1 mes | $2,700 | Mes |
Compromiso de 3 meses | $2,400 | Mes |
Compromiso de 1 año | $2,000 | Mes |
Ejemplo de cálculo de costes
Un usuario debe asegurarse de que puede soportar 10 consultas por segundo (QPS) de una consulta con una entrada de 1000 tokens de texto y 500 tokens de audio y recibir una salida de 300 tokens de texto utilizando gemini-2.0-flash.
Usando la tabla de rendimiento y tasa de evolución, para gemini-2.0-flash sabemos que la tasa de evolución de un token de texto de entrada es de 1 token, la tasa de evolución de un token de audio de entrada es de 7 tokens y la tasa de evolución de un token de texto de salida es de 4 tokens.
El total de tokens de entrada del usuario es de 1000* (1 token por cada token de texto de entrada) + 500* (7 tokens por cada token de audio de entrada) = 4500 tokens de entrada ajustados a la evolución. El total de tokens de salida del usuario es de 300* (4 tokens por cada token de texto de salida) = 1200 tokens de salida ajustados a la evolución. Al sumarlos, obtenemos 4500 tokens de entrada ajustados a la evolución + 1200 tokens de salida ajustados a la evolución = 5700 tokens en total por consulta.
Al multiplicar el total de tokens por consulta por QPS, obtenemos 5700 tokens totales por consulta * 10 QPS = 57 000 tokens totales por segundo.
Dividiendo esto entre el rendimiento total por segundo por GSU, obtenemos 57 000 tokens por segundo ÷ 3360 de rendimiento por segundo por GSU = 16,96 GSU. El incremento mínimo de compra de GSU para este modelo es de 1, por lo que el usuario necesitaría 17 GSU.
Si el usuario quisiera mantener este rendimiento durante una semana, el costo sería de $1200 * 17 GSU = $20 400 semanales. Si quisiera mantener este rendimiento durante un mes, el costo sería de $2700 * 17 GSU = $45 900 mensuales. Si quisiera mantener este rendimiento durante tres meses, el costo sería de $2400 * 17 GSU = $40 800 mensuales. Y, por último, si quisiera mantener este rendimiento durante un año, el costo sería de $2000 * 17 GSU = $34 000 mensuales.
Compare precios de modelos de socios en Vertex AI
Los modelos de socios son una lista seleccionada de modelos de IA generativa desarrollados por socios de Google. Se ofrecen como API administradas. Para obtener más información, consulte la sección "Descripción general de los modelos de socios ". En las siguientes secciones se detallan los precios de los modelos de socios de Google.
Modelos de AI21 Lab
Modelo | Precios |
---|---|
Jamba 1.5 Grande | Entrada: $2/millón de tokens Salida: $8/millón de tokens |
Jamba 1.5 Mini | Entrada: $0,20/millón de tokens Salida: $0,40/millón de tokens |
Los modelos Claude de Anthropic
Modelo | Precios |
---|---|
Claude Opus 4 | Entrada: $15/millón de tokens Salida: $75/millón de tokens Entrada por lotes: $7,50/millón de tokens Producción por lotes: $37,50/millón de tokens Escritura en caché: $18,75/millón de tokens Golpe de caché: $1,50/millón de tokens Escritura de caché por lotes: $9,375/millón de tokens Impacto de caché por lotes: $0,75/millón de tokens |
Soneto 4 de Claude | Entrada: $3/millón de tokens Salida: $15/millón de tokens Entrada por lotes: $1,50/millón de tokens Producción por lotes: $7,50/millón de tokens Escritura en caché: $3,75/millón de tokens Impacto de caché: $0,30/millón de tokens Escritura de caché por lotes: $1,875/millón de tokens Impacto de caché por lotes: $0,15/millón de tokens |
Soneto Claude 3.7 | Entrada: $3/millón de tokens Salida: $15/millón de tokens Entrada por lotes: $1,50/millón de tokens Producción por lotes: $7,50/millón de tokens Escritura en caché: $3,75/millón de tokens Impacto de caché: $0,30/millón de tokens Escritura de caché por lotes: $1,875/millón de tokens Impacto de caché por lotes: $0,15/millón de tokens |
Haiku de Claude 3.5 | Entrada: $0,80/millón de tokens Salida: $4/millón de tokens Entrada por lotes: $0,40/millón de tokens Producción por lotes: $2/millón de tokens Escritura en caché: $1/millón de tokens Impacto de caché: $0,08/millón de tokens Escritura de caché por lotes: $0,50/millón de tokens Impacto de caché por lotes: $0,04/millón de tokens |
Claude 3.5 Soneto v2 | Entrada: $3/millón de tokens Salida: $15/millón de tokens Entrada por lotes: $1,50/millón de tokens Producción por lotes: $7,50/millón de tokens Escritura en caché: $3,75/millón de tokens Impacto de caché: $0,30/millón de tokens Escritura de caché por lotes: $1,875/millón de tokens Impacto de caché por lotes: $0,15/millón de tokens |
Soneto Claude 3.5 | Entrada: $3/millón de tokens Salida: $15/millón de tokens Escritura en caché: $3,75/millón de tokens Impacto de caché: $0,30/millón de tokens |
Haiku de Claude 3 | Entrada: $0,25/millón de tokens Salida: $1,25/millón de tokens Escritura en caché: $0,30/millón de tokens Impacto de caché: $0,03/millón de tokens |
Claude 3 Sonnet (deprecated) | Entrada: $3/millón de tokens Salida: $15/millón de tokens |
Claude 3 Opus | Entrada: $15/millón de tokens Salida: $75/millón de tokens Escritura en caché: $18,75/millón de tokens Golpe de caché: $1,50/millón de tokens |
Modelos de llama de Meta
Modelo | Precios |
---|---|
Llama 3.1 405B | Entrada: $5.00 / millón de tokens Salida: $16,00/millón de tokens |
Llama 3.3 70B * | Entrada: $0,72/millón de tokens Salida: $0,72/millón de tokens |
Llama 4 Scout * | Entrada: $0,25/millón de tokens Salida: $0,70/millón de tokens |
Llama 4 Maverick * | Entrada: $0,35/millón de tokens Salida: $1,15/millón de tokens |
- Disponible sin cargo hasta el 1 de mayo de 2025.
Modelos de Mistral AI
Modelo | Precios |
---|---|
Mistral OCR (25.05) | Entrada: $0,0005/millón de tokens (o $0,0005/página) Salida: $0,0005/millón de tokens (o $0,0005/página) |
Mistral Pequeño 3.1 (25.03) | Entrada: $0,10/millón de tokens Salida: $0,30/millón de tokens |
Mistral Grande (24.11) | Entrada: $2.00 / millón de tokens Salida: $6,00/millón de tokens |
Mistral Nemo | Entrada: $0,15/millón de tokens Salida: $0,15/millón de tokens |
Codestral (25.01) | Entrada: $0,30/millón de tokens Salida: $0,90/millón de tokens |