Руководство по устранению неполадок

Используйте это руководство, чтобы помочь вам диагностировать и решать распространенные проблемы, возникающие при вызове Gemini API. Вы можете столкнуться с проблемами либо с бэкэнд-сервисом Gemini API, либо с клиентскими SDK. Наши клиентские SDK имеют открытый исходный код в следующих репозиториях:

Если у вас возникли проблемы с ключом API, убедитесь, что вы правильно настроили ключ API в соответствии с руководством по настройке ключа API .

Коды ошибок бэкэнд-службы API Gemini

В следующей таблице перечислены распространенные коды ошибок бэкэнда, с которыми вы можете столкнуться, а также объяснения их причин и шаги по устранению неполадок:

HTTP-код Статус Описание Пример Решение
400 НЕВЕРНЫЙ_АРГУМЕНТ Тело запроса сформировано неверно. В вашем запросе допущена опечатка или отсутствует обязательное поле. Проверьте справку API для формата запроса, примеров и поддерживаемых версий. Использование функций из более новой версии API со старой конечной точкой может привести к ошибкам.
400 НЕУДАЧНОЕ_ПРЕДУПРЕЖДЕНИЕ Бесплатный уровень Gemini API недоступен в вашей стране. Включите биллинг в вашем проекте в Google AI Studio. Вы делаете запрос в регионе, где бесплатный уровень не поддерживается, и вы не включили выставление счетов для своего проекта в Google AI Studio. Чтобы использовать API Gemini, вам необходимо настроить платный тарифный план с помощью Google AI Studio .
403 ДОСТУП ЗАПРЕЩЕН Ваш ключ API не имеет необходимых разрешений. Вы используете неправильный ключ API; вы пытаетесь использовать настроенную модель без прохождения надлежащей аутентификации . Проверьте, что ваш ключ API установлен и имеет правильный доступ. И обязательно пройдите надлежащую аутентификацию, чтобы использовать настроенные модели.
404 НЕ НАЙДЕНО Запрошенный ресурс не найден. Изображение, аудио или видеофайл, указанные в вашем запросе, не найдены. Проверьте, все ли параметры в вашем запросе соответствуют вашей версии API.
429 РЕСУРС_ИСЧЕРПАН Вы превысили лимит скорости. Вы отправляете слишком много запросов в минуту с помощью бесплатного API Gemini. Убедитесь, что вы находитесь в пределах лимита модели. При необходимости запросите увеличение квоты .
500 ВНУТРЕННИЙ На стороне Google произошла непредвиденная ошибка. Ваш входной контекст слишком длинный. Уменьшите входной контекст или временно переключитесь на другую модель (например, с Gemini 1.5 Pro на Gemini 1.5 Flash) и посмотрите, сработает ли это. Или подождите немного и повторите запрос. Если проблема сохраняется после повторной попытки, сообщите о ней с помощью кнопки «Отправить отзыв» в Google AI Studio.
503 НЕДОСТУПНО Служба может быть временно перегружена или недоступна. Возможности сервиса временно исчерпаны. Временно переключитесь на другую модель (например, с Gemini 1.5 Pro на Gemini 1.5 Flash) и посмотрите, сработает ли это. Или подождите немного и повторите запрос. Если проблема сохраняется после повторной попытки, сообщите об этом с помощью кнопки «Отправить отзыв» в Google AI Studio.
504 DEADLINE_EXCEEDED Служба не успевает завершить обработку в установленные сроки. Ваш запрос (или контекст) слишком велик для своевременной обработки. Чтобы избежать этой ошибки, установите больший «тайм-аут» в клиентском запросе.

Проверьте вызовы API на наличие ошибок параметров модели.

Убедитесь, что параметры вашей модели находятся в пределах следующих значений:

Параметр модели Значения (диапазон)
Количество кандидатов 1-8 (целое число)
Температура 0,0-1,0
Максимальное количество выходных токенов Используйте get_model ( Python ), чтобы определить максимальное количество токенов для используемой вами модели.
ТопП 0,0-1,0

В дополнение к проверке значений параметров убедитесь, что вы используете правильную версию API (например, /v1 или /v1beta ) и модель, которая поддерживает необходимые вам функции. Например, если функция находится в бета-версии, она будет доступна только в версии API /v1beta .

Проверьте, правильная ли у вас модель

Убедитесь, что вы используете поддерживаемую модель, указанную на нашей странице моделей .

Более высокая задержка или использование токенов в моделях 2.5

Если вы наблюдаете более высокую задержку или использование токенов с моделями 2.5 Flash и Pro, это может быть связано с тем, что они по умолчанию включают thinking , чтобы повысить качество. Если вы отдаете приоритет скорости или вам нужно минимизировать расходы, вы можете настроить или отключить thinking.

Пожалуйста, обратитесь к странице размышлений для получения рекомендаций и примера кода.

Вопросы безопасности

Если вы видите, что запрос заблокирован из-за настроек безопасности в вашем вызове API, проверьте запрос на предмет фильтров, которые вы установили в вызове API.

Если вы видите BlockedReason.OTHER , запрос или ответ могут нарушать условия обслуживания или иным образом не поддерживаться.

Проблема с декламацией

Если вы видите, что модель прекращает генерировать вывод из-за причины RECITATION, это означает, что вывод модели может напоминать определенные данные. Чтобы исправить это, попробуйте сделать приглашение / контекст максимально уникальными и используйте более высокую температуру.

Улучшить вывод модели

Для более качественных результатов модели изучите написание более структурированных подсказок. Страница руководства по инженерии подсказок знакомит вас с некоторыми базовыми концепциями, стратегиями и передовыми методами, с которых можно начать.

Если у вас есть сотни примеров хороших пар вход/выход, вы также можете рассмотреть возможность настройки модели .

Понять ограничения токенов

Прочитайте наше руководство по токенам , чтобы лучше понять, как подсчитывать токены и каковы их лимиты.

Известные проблемы

  • API поддерживает только несколько выбранных языков. Отправка запросов на неподдерживаемых языках может привести к неожиданным или даже заблокированным ответам. См. доступные языки для обновлений.

Сообщить об ошибке

Если у вас есть вопросы, присоединяйтесь к обсуждению на форуме разработчиков Google AI .