Руководство по устранению неполадок

Используйте это руководство, чтобы помочь вам диагностировать и решать распространенные проблемы, возникающие при вызове Gemini API. Вы можете столкнуться с проблемами либо с бэкэнд-сервисом Gemini API, либо с клиентскими SDK. Наши клиентские SDK имеют открытый исходный код в следующих репозиториях:

Если у вас возникли проблемы с ключом API, убедитесь, что вы правильно настроили ключ API в соответствии с руководством по настройке ключа API .

Коды ошибок бэкэнд-службы API Gemini

В следующей таблице перечислены распространенные коды ошибок бэкэнда, с которыми вы можете столкнуться, а также объяснения их причин и шаги по устранению неполадок:

HTTP-код	Статус	Описание	Пример	Решение
400	НЕВЕРНЫЙ_АРГУМЕНТ	Тело запроса сформировано неверно.	В вашем запросе допущена опечатка или отсутствует обязательное поле.	Проверьте справку API для формата запроса, примеров и поддерживаемых версий. Использование функций из более новой версии API со старой конечной точкой может привести к ошибкам.
400	НЕУДАЧНОЕ_ПРЕДУПРЕЖДЕНИЕ	Бесплатный уровень Gemini API недоступен в вашей стране. Включите биллинг в вашем проекте в Google AI Studio.	Вы делаете запрос в регионе, где бесплатный уровень не поддерживается, и вы не включили выставление счетов для своего проекта в Google AI Studio.	Чтобы использовать API Gemini, вам необходимо настроить платный тарифный план с помощью Google AI Studio .
403	ДОСТУП ЗАПРЕЩЕН	Ваш ключ API не имеет необходимых разрешений.	Вы используете неправильный ключ API; вы пытаетесь использовать настроенную модель без прохождения надлежащей аутентификации .	Проверьте, что ваш ключ API установлен и имеет правильный доступ. И обязательно пройдите надлежащую аутентификацию, чтобы использовать настроенные модели.
404	НЕ НАЙДЕНО	Запрошенный ресурс не найден.	Изображение, аудио или видеофайл, указанные в вашем запросе, не найдены.	Проверьте, все ли параметры в вашем запросе соответствуют вашей версии API.
429	РЕСУРС_ИСЧЕРПАН	Вы превысили лимит скорости.	Вы отправляете слишком много запросов в минуту с помощью бесплатного API Gemini.	Убедитесь, что вы находитесь в пределах лимита модели. При необходимости запросите увеличение квоты .
500	ВНУТРЕННИЙ	На стороне Google произошла непредвиденная ошибка.	Ваш входной контекст слишком длинный.	Уменьшите входной контекст или временно переключитесь на другую модель (например, с Gemini 1.5 Pro на Gemini 1.5 Flash) и посмотрите, сработает ли это. Или подождите немного и повторите запрос. Если проблема сохраняется после повторной попытки, сообщите о ней с помощью кнопки «Отправить отзыв» в Google AI Studio.
503	НЕДОСТУПНО	Служба может быть временно перегружена или недоступна.	Возможности сервиса временно исчерпаны.	Временно переключитесь на другую модель (например, с Gemini 1.5 Pro на Gemini 1.5 Flash) и посмотрите, сработает ли это. Или подождите немного и повторите запрос. Если проблема сохраняется после повторной попытки, сообщите об этом с помощью кнопки «Отправить отзыв» в Google AI Studio.
504	DEADLINE_EXCEEDED	Служба не успевает завершить обработку в установленные сроки.	Ваш запрос (или контекст) слишком велик для своевременной обработки.	Чтобы избежать этой ошибки, установите больший «тайм-аут» в клиентском запросе.

Проверьте вызовы API на наличие ошибок параметров модели.

Убедитесь, что параметры вашей модели находятся в пределах следующих значений:

Параметр модели	Значения (диапазон)
Количество кандидатов	1-8 (целое число)
Температура	0,0-1,0
Максимальное количество выходных токенов	Используйте `get_model` ( Python ), чтобы определить максимальное количество токенов для используемой вами модели.
ТопП	0,0-1,0

В дополнение к проверке значений параметров убедитесь, что вы используете правильную версию API (например, /v1 или /v1beta ) и модель, которая поддерживает необходимые вам функции. Например, если функция находится в бета-версии, она будет доступна только в версии API /v1beta .

Проверьте, правильная ли у вас модель

Убедитесь, что вы используете поддерживаемую модель, указанную на нашей странице моделей .

Более высокая задержка или использование токенов в моделях 2.5

Если вы наблюдаете более высокую задержку или использование токенов с моделями 2.5 Flash и Pro, это может быть связано с тем, что они по умолчанию включают thinking , чтобы повысить качество. Если вы отдаете приоритет скорости или вам нужно минимизировать расходы, вы можете настроить или отключить thinking.

Пожалуйста, обратитесь к странице размышлений для получения рекомендаций и примера кода.

Вопросы безопасности

Если вы видите, что запрос заблокирован из-за настроек безопасности в вашем вызове API, проверьте запрос на предмет фильтров, которые вы установили в вызове API.

Если вы видите BlockedReason.OTHER , запрос или ответ могут нарушать условия обслуживания или иным образом не поддерживаться.

Проблема с декламацией

Если вы видите, что модель прекращает генерировать вывод из-за причины RECITATION, это означает, что вывод модели может напоминать определенные данные. Чтобы исправить это, попробуйте сделать приглашение / контекст максимально уникальными и используйте более высокую температуру.

Улучшить вывод модели

Для более качественных результатов модели изучите написание более структурированных подсказок. Страница руководства по инженерии подсказок знакомит вас с некоторыми базовыми концепциями, стратегиями и передовыми методами, с которых можно начать.

Если у вас есть сотни примеров хороших пар вход/выход, вы также можете рассмотреть возможность настройки модели .

Понять ограничения токенов

Прочитайте наше руководство по токенам , чтобы лучше понять, как подсчитывать токены и каковы их лимиты.

Известные проблемы

API поддерживает только несколько выбранных языков. Отправка запросов на неподдерживаемых языках может привести к неожиданным или даже заблокированным ответам. См. доступные языки для обновлений.

Сообщить об ошибке

Если у вас есть вопросы, присоединяйтесь к обсуждению на форуме разработчиков Google AI .