Начните работу со встроенным искусственным интеллектом

Опубликовано: 12 декабря 2024 г., Последнее обновление: 20 мая 2025 г.

Благодаря встроенным API ИИ ваше веб-приложение может выполнять задачи на базе ИИ без необходимости развертывания или управления собственными моделями ИИ.

Требования

Мы работаем над стандартизацией этих API во всех браузерах .

Модели

API Prompt, Summarizer, Writer и Rewriter загружают обширную языковую модель, разработанную для локального запуска на настольных компьютерах и ноутбуках. Эти API не работают на мобильных устройствах. Перед использованием этих API ознакомьтесь с Политикой Google в отношении запрещенного использования генеративного ИИ .

На данный момент Summarizer API, Writer API и Rewriter API поддерживают только модальность «текст-текст». Prompt API предоставляет многомодальные возможности для локального прототипирования участникам программы раннего ознакомления.

Аппаратное обеспечение

Для разработчиков и пользователей, использующих эти API в Chrome, действуют следующие требования. Требования к работе других браузеров могут отличаться.

API определения языка и переводчика работают в Chrome на десктопе. Эти API не работают на мобильных устройствах. API Prompt, API Summarizer, API Writer и API Rewriter работают в Chrome при соблюдении следующих условий:

  • Операционная система : Windows 10 или 11; macOS 13+ (Ventura и выше); или Linux. Chrome для Android, iOS и ChromeOS пока не поддерживаются API, использующими Gemini Nano.
  • Хранилище : не менее 22 ГБ на томе, содержащем ваш профиль Chrome.
  • Графический процессор : строго более 4 ГБ видеопамяти.
  • Сеть : Неограниченные данные или безлимитное соединение.

Точный размер Gemini Nano может незначительно отличаться. Чтобы узнать текущий размер, посетите chrome://on-device-internals и перейдите в раздел «Статус модели» . Откройте указанный путь к файлу , чтобы определить размер модели.

Начать строительство

Существует несколько встроенных API для искусственного интеллекта, находящихся на разных стадиях разработки. Некоторые из них доступны в стабильной версии Chrome, другие — участникам тестовой версии Origin, а третьи — только участникам программы раннего ознакомления .

Каждый API имеет собственный набор инструкций по началу работы и загрузке модели как для локального прототипирования, так и для производственных сред с исходными пробными версиями.

Все эти API можно использовать при создании расширений Chrome.

Используйте API на локальном хосте

Все API доступны на localhost в Chrome.

  1. Перейдите по адресу chrome://flags/#prompt-api-for-gemini-nano .
  2. Выберите Включено .
  3. Нажмите «Перезапустить» или перезапустите Chrome.

Чтобы убедиться, что Gemini Nano загружен и работает как задумано, откройте DevTools и введите в консоли await LanguageModel.availability(); Должно быть возвращено значение available .

Устранение неполадок локального хоста

Если модель не работает так, как ожидалось, выполните следующие действия:

  1. Перезапустите Chrome.
  2. Перейдите по адресу chrome://components .
  3. Убедитесь, что доступно руководство по оптимизации для модели устройства . Это означает, что Gemini Nano либо доступен, либо загружается.
    • Если номер версии не указан, нажмите «Проверить наличие обновлений» , чтобы принудительно выполнить загрузку.
  4. Откройте DevTools и введите в консоли LanguageModel.availability(); Должен быть возвращен available .

При необходимости подождите некоторое время и повторите эти действия.

Процесс стандартизации

Мы работаем над стандартизацией этих API , чтобы они работали во всех браузерах. Это означает, что мы предложили эти API сообществу веб-платформ и перенесли их в группу сообщества W3C Web Incubator для дальнейшего обсуждения.

Мы запрашиваем отзывы от W3C, Mozilla и WebKit по каждому API.

Более подробную информацию об этом процессе для каждого API можно найти в соответствующей документации.

Привлекайте и делитесь отзывами

Если вы попробуете встроенный ИИ и у вас есть отзывы, мы будем рады их услышать.