Este documento lista as cotas e limites do sistema que se aplicam ao Gemini para Google Cloud.
- As cotas especificam a quantidade de um recurso compartilhado e contável que você pode usar. As cotas são definidas por Google Cloud serviços como Gemini para Google Cloud.
- Os limites do sistema são valores fixos que não podem ser alterados.
Google Cloud usa cotas para ajudar a garantir a justiça e reduzir picos no uso e disponibilidade de recursos. Uma cota restringe a quantidade de umGoogle Cloud recursos para você Google Cloud O projeto pode usar. As cotas se aplicam a uma variedade de tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo seu projeto ou o número de projetos que você pode criar. As cotas protegem a comunidade deGoogle Cloud usuários, evitando a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios Google Cloud recursos.
O sistema Cloud Quotas faz o seguinte:
- Monitora seu consumo de Google Cloud produtos e serviços
- Restringe o consumo desses recursos
- Fornece uma maneira de solicitar alterações no valor da cota e automatizar os ajustes de cota
Na maioria dos casos, quando você tenta consumir mais de um recurso do que sua cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.
As quotas geralmente aplicam-se a Google Cloud nível de projeto. O uso de um recurso em um projeto não afeta sua cota disponível em outro projeto. Dentro de um Google Cloud projeto, as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Também há limites de sistema para os recursos do Gemini. Os limites do sistema não podem ser alterados.
Solicitações por segundo
Gêmeos para Google Cloud aplica cotas de solicitações por segundo para cada usuário em um projeto.
Contingente | Valor |
---|---|
Solicitações por segundo | 2 |
Solicitações por dia
Gêmeos para Google Cloud aplica cotas para o número total de solicitações por dia para cada usuário em um projeto.
Contingente | Valor |
---|---|
Solicitações por dia para o Gemini Code Assist ou Gemini no BigQuery, como geração de código e conclusão de código. | 6000 |
Solicitações por dia para bate-papo, visualização, varreduras de tabelas de insights de dados, geração de metadados, preparação de dados e outras solicitações que exibem respostas no painel Cloud Assist no Google Cloud console e IDEs. | 960 |
Cotas para Gemini Code Assist
O Gemini Code Assist impõe cotas para determinados recursos.
Contingente | Valor |
---|---|
Conscientização da base de código local | Janela de contexto de 128.000 tokens |
Repositórios de personalização de código | 20.000 |
Cotas para Gemini no BigQuery
Para recursos de assistência de código, a cota para Gemini Code Assist e Gemini em solicitações de código do BigQuery para recursos como conclusão de código e geração de código é a mesma.
Para clientes que usam o Gemini no BigQuery com computação sob demanda do BigQuery ou com as edições Enterprise ou Enterprise Plus, as cotas para recursos avançados, como insights de dados, são fornecidas com base na média diária de uso de TiB digitalizados ou nas horas-slot do último mês completo. Essa cota se aplica ao nível da organização e está disponível para todos os projetos dessa organização. As cotas são arredondadas para o uso de 100 horas-slot mais próximo.
Cotas por 100 horas de slot (uso médio diário da edição Enterprise ou Enterprise Plus) ou por TiB escaneado usando modelo de computação sob demanda | Valor |
---|---|
Solicitações por dia para bate-papo, visualização, varreduras de tabela e outras solicitações que exibem respostas no painel do Cloud Assist no Google Cloud console. | 5 |
Exemplo : Uma organização que possui uma reserva da edição Enterprise com 100 slots como base utilizará uma média de 2.400 slots-hora por dia (100 slots * 24 horas = 2.400 slots-hora). Como resultado, no mês seguinte, ela obtém as seguintes cotas diárias:
- 120 bate-papos, visualizações, varreduras de tabelas de insights de dados e gerações automatizadas de metadados por dia
Se sua organização não tiver adquirido nenhum slot do BigQuery Enterprise Edition, Enterprise Plus Edition ou computação sob demanda (TiB) até agora, após o primeiro uso, você receberá a cota padrão do seguinte para o primeiro mês civil completo:
- 250 chats, visualizações, varreduras de tabelas de insights de dados e gerações automatizadas de metadados por dia
Se você começar a usar a computação sob demanda, as reservas da edição Enterprise ou Enterprise Plus no meio do mês, a cota padrão será aplicada até o final do mês seguinte.
Solicitar aumento de cota
Para ajustar a maioria das cotas, use o Google Cloud console. Para obter mais informações, consulte Solicitar um ajuste de cota .