Auf dieser Seite werden die ersten Schritte mit den Cloud-Clientbibliotheken für die Document AI Toolbox API beschrieben. Clientbibliotheken erleichtern den Zugriff aufGoogle Cloud -APIs mit einer unterstützten Sprache. Sie könnenGoogle Cloud APIs direkt verwenden, indem Sie Rohdatenanfragen an den Server senden. Clientbibliotheken bieten jedoch Vereinfachungen, die den zu schreibenden Code erheblich reduzieren.
Weitere Informationen zu den Cloud-Clientbibliotheken und den älteren Google API-Clientbibliotheken finden Sie unter Erläuterung zu Clientbibliotheken.
Clientbibliothek installieren
Python
pip install --upgrade google-cloud-documentai-toolbox
Weitere Informationen finden Sie unter Python-Entwicklungsumgebung einrichten.
Authentifizierung einrichten
Zur Authentifizierung von Aufrufen an Google Cloud APIs unterstützen Clientbibliotheken Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC). Die Bibliotheken suchen nach Anmeldedaten an einer Reihe von definierten Standorten und verwenden diese Anmeldedaten, um Anfragen an die API zu authentifizieren. Mit ADC können Sie Anmeldedaten für Ihre Anwendung in verschiedenen Umgebungen bereitstellen, z. B. in der lokalen Entwicklung oder Produktion, ohne den Anwendungscode ändern zu müssen.In Produktionsumgebungen hängt die Art der Einrichtung von ADC vom Dienst und Kontext ab. Weitere Informationen finden Sie unter Standardanmeldedaten für Anwendungen einrichten.
Für eine lokale Entwicklungsumgebung können Sie ADC mit den Anmeldedaten einrichten, die Ihrem Google-Konto zugeordnet sind:
-
Install the Google Cloud CLI. After installation, initialize the Google Cloud CLI by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
Ein Anmeldebildschirm wird angezeigt. Nach der Anmeldung werden Ihre Anmeldedaten in der lokalen Anmeldedatendatei für ADC gespeichert.
Clientbibliothek verwenden
Die Document AI Toolbox ist ein SDK für Python, das Dienstfunktionen zum Verwalten, Bearbeiten und Extrahieren von Informationen aus der Dokumentantwort bietet.
Es wird ein „umschlossenes“ Dokumentobjekt aus einer Antwort für ein verarbeitetes Dokument aus JSON-Dateien in Cloud Storage, lokalen JSON-Dateien oder der direkten Ausgabe der Methode process_document()
erstellt.
Sie kann die folgenden Aktionen ausführen:
- Kombinieren Sie fragmentierte
Document
-JSON-Dateien aus der Batchverarbeitung in einem einzelnen „umschlossenen“ Dokument. - Shards als einheitliche
Document
exportieren. -
Document
-Ausgabe abrufen von: - Zugriff auf Text aus
Pages
,Lines
,Paragraphs
,FormFields
undTables
, ohneLayout
-Informationen zu verarbeiten. - Suchen Sie nach einem
Pages
, das einen Zielstring enthält oder einem regulären Ausdruck entspricht. - Suchen Sie nach
FormFields
. - Nach
Entities
nach Typ suchen. - Konvertieren Sie
Tables
in einen Pandas-DataFrame oder eine CSV-Datei. - Fügen Sie
Entities
undFormFields
in eine BigQuery-Tabelle ein. - Eine PDF-Datei basierend auf der Ausgabe eines Splitter-/Klassifikatorprozessors aufteilen.
- Extrahiere das Bild
Entities
aus denDocument
-Begrenzungsrahmen. -
Documents
in häufig verwendete Formate konvertieren und umgekehrt:- Cloud Vision API
AnnotateFileResponse
- hOCR
- Formate für die Dokumentverarbeitung durch Drittanbieter
- Cloud Vision API
- Erstellen Sie Batches von Dokumenten zur Verarbeitung aus einem Cloud Storage-Ordner.
Codebeispiele
Die folgenden Codebeispiele zeigen, wie Sie die Document AI Toolbox verwenden.
Kurzanleitung
Tabellen
BigQuery Export
PDF aufteilen
Bildextraktion
Vision-Conversion
hOCR-Konvertierung
Drittanbieter-Conversion
Dokument-Batches
Dokument-Shards zusammenführen
Zusätzliche Ressourcen
Python
Die folgende Liste enthält Links zu weiteren Ressourcen im Zusammenhang mit der Clientbibliothek für Python: