Используйте это руководство, чтобы помочь вам диагностировать и решать распространенные проблемы, возникающие при вызове Gemini API. Вы можете столкнуться с проблемами либо с бэкэнд-сервисом Gemini API, либо с клиентскими SDK. Наши клиентские SDK имеют открытый исходный код в следующих репозиториях:
Если у вас возникли проблемы с ключом API, убедитесь, что вы правильно настроили ключ API в соответствии с руководством по настройке ключа API .
Коды ошибок бэкэнд-службы API Gemini
В следующей таблице перечислены распространенные коды ошибок бэкэнда, с которыми вы можете столкнуться, а также объяснения их причин и шаги по устранению неполадок:
HTTP-код | Статус | Описание | Пример | Решение |
400 | НЕВЕРНЫЙ_АРГУМЕНТ | Тело запроса сформировано неверно. | В вашем запросе допущена опечатка или отсутствует обязательное поле. | Проверьте справку API для формата запроса, примеров и поддерживаемых версий. Использование функций из более новой версии API со старой конечной точкой может привести к ошибкам. |
400 | НЕУДАЧНОЕ_ПРЕДУПРЕЖДЕНИЕ | Бесплатный уровень Gemini API недоступен в вашей стране. Включите биллинг в вашем проекте в Google AI Studio. | Вы делаете запрос в регионе, где бесплатный уровень не поддерживается, и вы не включили выставление счетов для своего проекта в Google AI Studio. | Чтобы использовать API Gemini, вам необходимо настроить платный тарифный план с помощью Google AI Studio . |
403 | ДОСТУП ЗАПРЕЩЕН | Ваш ключ API не имеет необходимых разрешений. | Вы используете неправильный ключ API; вы пытаетесь использовать настроенную модель без прохождения надлежащей аутентификации . | Проверьте, что ваш ключ API установлен и имеет правильный доступ. И обязательно пройдите надлежащую аутентификацию, чтобы использовать настроенные модели. |
404 | НЕ НАЙДЕНО | Запрошенный ресурс не найден. | Изображение, аудио или видеофайл, указанные в вашем запросе, не найдены. | Проверьте, все ли параметры в вашем запросе соответствуют вашей версии API. |
429 | РЕСУРС_ИСЧЕРПАН | Вы превысили лимит скорости. | Вы отправляете слишком много запросов в минуту с помощью бесплатного API Gemini. | Убедитесь, что вы находитесь в пределах лимита модели. При необходимости запросите увеличение квоты . |
500 | ВНУТРЕННИЙ | На стороне Google произошла непредвиденная ошибка. | Ваш входной контекст слишком длинный. | Уменьшите входной контекст или временно переключитесь на другую модель (например, с Gemini 1.5 Pro на Gemini 1.5 Flash) и посмотрите, сработает ли это. Или подождите немного и повторите запрос. Если проблема сохраняется после повторной попытки, сообщите о ней с помощью кнопки «Отправить отзыв» в Google AI Studio. |
503 | НЕДОСТУПНО | Служба может быть временно перегружена или недоступна. | Возможности сервиса временно исчерпаны. | Временно переключитесь на другую модель (например, с Gemini 1.5 Pro на Gemini 1.5 Flash) и посмотрите, сработает ли это. Или подождите немного и повторите запрос. Если проблема сохраняется после повторной попытки, сообщите об этом с помощью кнопки «Отправить отзыв» в Google AI Studio. |
504 | DEADLINE_EXCEEDED | Служба не успевает завершить обработку в установленные сроки. | Ваш запрос (или контекст) слишком велик для своевременной обработки. | Чтобы избежать этой ошибки, установите больший «тайм-аут» в клиентском запросе. |
Проверьте вызовы API на наличие ошибок параметров модели.
Убедитесь, что параметры вашей модели находятся в пределах следующих значений:
Параметр модели | Значения (диапазон) |
Количество кандидатов | 1-8 (целое число) |
Температура | 0,0-1,0 |
Максимальное количество выходных токенов | Используйте get_model ( Python ), чтобы определить максимальное количество токенов для используемой вами модели. |
ТопП | 0,0-1,0 |
В дополнение к проверке значений параметров убедитесь, что вы используете правильную версию API (например, /v1
или /v1beta
) и модель, которая поддерживает необходимые вам функции. Например, если функция находится в бета-версии, она будет доступна только в версии API /v1beta
.
Проверьте, правильная ли у вас модель
Убедитесь, что вы используете поддерживаемую модель, указанную на нашей странице моделей .
Более высокая задержка или использование токенов в моделях 2.5
Если вы наблюдаете более высокую задержку или использование токенов с моделями 2.5 Flash и Pro, это может быть связано с тем, что они по умолчанию включают thinking , чтобы повысить качество. Если вы отдаете приоритет скорости или вам нужно минимизировать расходы, вы можете настроить или отключить thinking.
Пожалуйста, обратитесь к странице размышлений для получения рекомендаций и примера кода.
Вопросы безопасности
Если вы видите, что запрос заблокирован из-за настроек безопасности в вашем вызове API, проверьте запрос на предмет фильтров, которые вы установили в вызове API.
Если вы видите BlockedReason.OTHER
, запрос или ответ могут нарушать условия обслуживания или иным образом не поддерживаться.
Проблема с декламацией
Если вы видите, что модель прекращает генерировать вывод из-за причины RECITATION, это означает, что вывод модели может напоминать определенные данные. Чтобы исправить это, попробуйте сделать приглашение / контекст максимально уникальными и используйте более высокую температуру.
Улучшить вывод модели
Для более качественных результатов модели изучите написание более структурированных подсказок. Страница руководства по инженерии подсказок знакомит вас с некоторыми базовыми концепциями, стратегиями и передовыми методами, с которых можно начать.
Если у вас есть сотни примеров хороших пар вход/выход, вы также можете рассмотреть возможность настройки модели .
Понять ограничения токенов
Прочитайте наше руководство по токенам , чтобы лучше понять, как подсчитывать токены и каковы их лимиты.
Известные проблемы
- API поддерживает только несколько выбранных языков. Отправка запросов на неподдерживаемых языках может привести к неожиданным или даже заблокированным ответам. См. доступные языки для обновлений.
Сообщить об ошибке
Если у вас есть вопросы, присоединяйтесь к обсуждению на форуме разработчиков Google AI .