PaLM 2-Modelle

PaLM 2 ist eine Familie von Sprachmodellen, die für die einfache Verwendung bei wichtigen Entwickleranwendungsfällen optimiert sind. Die PaLM-Modellfamilie enthält Varianten, die für die Text- und Chatgenerierung sowie für Texteinbettungen trainiert wurden. Dieser Leitfaden enthält Informationen zu jeder Variante, damit Sie entscheiden können, welche für Ihren Anwendungsfall am besten geeignet ist.

Modellgrößen

Die Modellgrößen werden durch den Namen eines Tiers beschrieben. In der folgenden Tabelle sehen Sie die verfügbaren Größen und ihre Bedeutung im Verhältnis zueinander.

Modellgröße	Beschreibung	Dienste
Bison	Leistungsstärkste PaLM 2-Modellgröße.	Text chat
Gecko	Kleinste und effizienteste PaLM 2-Modellgröße.	Einbettungen

Modellvarianten

Für bestimmte Anwendungsfälle sind verschiedene PaLM-Modelle verfügbar und optimiert. In der folgenden Tabelle werden die jeweiligen Attribute beschrieben.

Variation	Attribut	Beschreibung
Bison-Text	Letzte Aktualisierung des Modells	Mai 2023
	Modellcode	`text-bison-001`
	Modellfunktionen	Eingabe: Text Ausgabe: Text Optimiert für Sprachaufgaben wie: Codegenerierung Textgenerierung Textbearbeitung Probleme lösen Empfehlungsgenerierung Informationsextraktion Datenextraktion oder -generierung KI-Agent Kann null, eine und wenige Aufgaben erledigen.
	Modellsicherheit	Anpassbare Sicherheitseinstellungen für 6 Dimensionen von Schäden für Entwickler verfügbar. Weitere Informationen finden Sie unter Sicherheitseinstellungen.
	Ratenbegrenzung	90 Anfragen pro Minute

Bison – Chat	Letzte Aktualisierung des Modells	Mai 2023
	Modellcode	`chat-bison-001`
	Modellfunktionen	Eingabe: Text Ausgabe: Text Generiert Text in einem dialogorientierten Format. Optimiert für Aufgaben der Dialogsprache wie die Implementierung von Chatbots oder KI-Agents. Kann null, eine und wenige Aufgaben erledigen.
	Modellsicherheit	Keine anpassbaren Sicherheitseinstellungen.
	Ratenbegrenzung	90 Anfragen pro Minute

Geckoeinbettung	Letzte Aktualisierung des Modells	Mai 2023
	Modellcode	`embedding-gecko-001`
	Modellfunktionen	Eingabe: Text Ausgabe: Text Erzeugt Texteinbettungen für den Eingabetext. Optimiert für das Erstellen von Einbettungen für Text mit bis zu 1.024 Tokens.
	Modellsicherheit	Keine anpassbaren Sicherheitseinstellungen.
	Ratenbegrenzung	1.500 Anfragen pro Minute

Modellmetadaten

Mit der ModelService API können Sie zusätzliche Metadaten zu den neuesten Modellen abrufen, z. B. Limits für Eingabe- und Ausgabetokens. In der folgenden Tabelle sind die Metadaten für die Modellvariante text-bison-001 aufgeführt.

Attribut	Wert
Anzeigename	SMS-Bison
Modellcode	`models/text-bison-001`
Beschreibung	Modell, auf das Textgenerierung ausgerichtet ist
Limit für Eingabetoken	8196
Limit für Ausgabetokens	1024
Unterstützte Generierungsmethoden	`generateText`
Temperatur	0.7
top_p	0,95
top_k	40

Modellattribute

In der folgenden Tabelle werden die Attribute der PaLM 2 beschrieben, die allen Modellvarianten gemeinsam sind.

Attribut	Beschreibung
Trainingsdaten	Für PaLM 2 ist Mitte 2021 der Stichtag für die Wissensvermittlung. Das Wissen über Ereignisse, die nach diesem Zeitraum stattfinden, ist begrenzt.
Unterstützte Sprachen	Englisch
Konfigurierbare Modellparameter	Top P Top K Temperatur Sequenz beenden Maximale Ausgabelänge Anzahl der Antwortkandidaten

Informationen zu den einzelnen Parametern finden Sie im Abschnitt Modellparameter des Leitfadens „Einführung in LLMs“.