Veröffentlicht am 12. Dezember 2024, zuletzt aktualisiert am 20. Mai 2025
Mit integrierten KI-APIs kann Ihre Webanwendung KI-basierte Aufgaben ausführen, ohne dass Sie eigene KI-Modelle bereitstellen oder verwalten müssen.
Voraussetzungen
Wir arbeiten daran, diese APIs browserübergreifend zu standardisieren.
Modelle
Bei der Prompt API, Summarizer API, Writer API und Rewriter API wird ein großes Sprachmodell heruntergeladen, das für die lokale Ausführung auf Desktop- und Laptop-Computern konzipiert ist. Diese APIs funktionieren nicht auf Mobilgeräten. Bevor Sie diese APIs verwenden, müssen Sie die Richtlinie zur unzulässigen Nutzung von generativer KI von Google bestätigen.
Derzeit unterstützen die Summarizer API, Writer API und Rewriter API nur die Text-zu-Text-Modalität. Die Prompt API bietet multimodale Funktionen, die Teilnehmern des Early Preview Program für das lokale Prototyping zur Verfügung stehen.
Hardware
Für Entwickler und Nutzer, die Funktionen mit diesen APIs in Chrome verwenden, gelten die folgenden Anforderungen. Bei anderen Browsern gelten möglicherweise andere Betriebsanforderungen.
Die APIs für die Spracherkennung und die Übersetzung funktionieren in der Desktopversion von Chrome. Diese APIs funktionieren nicht auf Mobilgeräten. Die Prompt API, Summarizer API, Writer API und Rewriter API funktionieren in Chrome, wenn die folgenden Bedingungen erfüllt sind:
- Betriebssystem: Windows 10 oder 11, macOS 13 oder höher (Ventura und höher) oder Linux. Chrome für Android, iOS und ChromeOS wird von den APIs, die Gemini Nano verwenden, noch nicht unterstützt.
- Speicherplatz: Mindestens 22 GB auf dem Volume, das Ihr Chrome-Profil enthält.
- GPU: Mehr als 4 GB VRAM.
- Netzwerk: Unbegrenzte Daten oder eine Verbindung ohne Volumenbegrenzung.
Die genaue Größe von Gemini Nano kann leicht variieren. Die aktuelle Größe finden Sie unter chrome://on-device-internals
im Bereich Modellstatus.
Öffnen Sie den aufgeführten Dateipfad, um die Modellgröße zu ermitteln.
Gleich mit dem Erstellen loslegen
Es gibt mehrere integrierte KI-APIs, die sich in verschiedenen Entwicklungsphasen befinden. Einige sind in der stabilen Chrome-Version verfügbar, andere für Teilnehmer von Ursprungstests und wieder andere nur für Teilnehmer des Early Preview Program.
Für jede API gibt es eine eigene Anleitung für die ersten Schritte und zum Herunterladen des Modells, sowohl für das lokale Prototyping als auch für Produktionsumgebungen mit den Origin Trials.
- Translator API
- Language Detector API
- Summarizer API
- Prompt API
- Prompt API in Chrome-Erweiterungen enthält spezifische Anleitungen für Entwickler von Erweiterungen, die die Prompt API verwenden möchten.
- Writer API und Rewriter API
- Prompt API zur Verwendung in Chrome-Erweiterungen
- Prompt API for Web (nur EPP)
Alle diese APIs können beim Erstellen von Chrome-Erweiterungen verwendet werden.
APIs auf localhost verwenden
Alle APIs sind in Chrome auf localhost
verfügbar.
- Öffnen Sie
chrome://flags/#prompt-api-for-gemini-nano
. - Wählen Sie Aktiviert aus.
- Klicken Sie auf Neu starten oder starten Sie Chrome neu.
Um zu prüfen, ob Gemini Nano heruntergeladen wurde und wie vorgesehen funktioniert, öffnen Sie die Entwicklertools und geben Sie await LanguageModel.availability();
in die Konsole ein. In diesem Fall sollte available
zurückgegeben werden.
Fehlerbehebung bei localhost
Wenn das Modell nicht wie erwartet funktioniert, gehen Sie so vor:
- Starten Sie Chrome neu.
- Öffnen Sie
chrome://components
. - Prüfen Sie, ob Optimierungsleitfaden für Gerätemodell vorhanden ist. Das bedeutet, dass Gemini Nano entweder verfügbar ist oder gerade heruntergeladen wird.
- Wenn keine Versionsnummer aufgeführt ist, klicken Sie auf Nach Updates suchen, um den Download zu erzwingen.
- Öffnen Sie die Entwicklertools und geben Sie
LanguageModel.availability();
in die Konsole ein. In diesem Fall sollteavailable
zurückgegeben werden.
Warten Sie gegebenenfalls einige Zeit und wiederholen Sie diese Schritte.
Standards-Prozess
Wir arbeiten daran, diese APIs zu standardisieren, damit sie in allen Browsern funktionieren. Das bedeutet, dass wir die APIs der Webplattform-Community vorgeschlagen und sie zur weiteren Diskussion in die W3C Web Incubator Community Group verschoben haben.
Wir bitten das W3C, Mozilla und WebKit um Feedback zu jeder API.
Weitere Informationen zu diesem Prozess für die einzelnen APIs finden Sie in der entsprechenden Dokumentation.
Feedback geben
Wenn Sie die integrierte KI ausprobieren und Feedback dazu haben, freuen wir uns darauf, von Ihnen zu hören.
- Alle integrierten KI-APIs
- Am Early Preview-Programm teilnehmen, um neue APIs vorab kennenzulernen und Zugriff auf unsere Mailingliste zu erhalten.
- Wenn Sie Feedback zur Implementierung in Chrome haben, erstellen Sie in Chromium einen Eintrag für das Problem.
- Weitere Informationen zu Webstandards