Cette page a été traduite par l'API Cloud Translation.

Présentation de l'IA générative

Ce document décrit les fonctionnalités d'intelligence artificielle (IA) générative compatibles avec BigQuery ML. Ces fonctionnalités vous permettent d'effectuer des tâches d'IA dans BigQuery ML à l'aide de modèles Vertex AI pré-entraînés et de modèles BigQuery ML intégrés.

Les tâches suivantes sont acceptées :

Générer du texte
Générer des données structurées
Générer des valeurs d'un type spécifique par ligne
Générer des embeddings
Prévoir des séries temporelles

Vous accédez à un modèle Vertex AI pour exécuter l'une de ces fonctions en créant un dans BigQuery ML modèle distant qui représente le point de terminaison du modèle Vertex AI. Une fois que vous avez créé un modèle distant basé sur le modèle Vertex AI que vous souhaitez utiliser, vous accédez aux fonctionnalités de ce modèle en exécutant une fonction BigQuery ML sur le modèle distant.

Cette approche vous permet d'utiliser les fonctionnalités de ces modèles Vertex AI dans des requêtes SQL pour analyser les données BigQuery.

Workflow

Vous pouvez utiliser des modèles distants basés sur des modèles Vertex AI et des modèles distants basés sur des services Cloud AI conjointement avec des fonctions BigQuery ML afin d'effectuer des tâches d'analyse de données et d'IA générative complexes.

Le schéma suivant illustre certains workflows types dans lesquels vous pouvez utiliser ces fonctionnalités conjointement :

Schéma illustrant les workflows courants pour les modèles distants qui utilisent des modèles Vertex AI ou des services Cloud AI.

Générer du texte

La génération de texte est une forme d'IA générative dans laquelle le texte est généré en fonction d'une requête ou d'une analyse de données. Vous pouvez effectuer une génération de texte à l'aide de données textuelles et multimodales.

Voici quelques cas d'utilisation courants de la génération de texte:

Générer des contenus originaux
Génération de code.
Générer des réponses par chat ou par e-mail
Brainstorming, par exemple en suggérant des pistes pour de futurs produits ou services
Personnalisation du contenu, comme les suggestions de produits
Classer les données en appliquant un ou plusieurs libellés au contenu pour le trier en catégories.
Identifier les principaux sentiments exprimés dans le contenu.
Résumez les idées ou impressions clés véhiculées par le contenu.
Identifier une ou plusieurs entités importantes dans des données textuelles ou visuelles.
Traduire le contenu de données textuelles ou audio dans une autre langue
Générer du texte correspondant au contenu verbal des données audio
Créer des sous-titres ou répondre à des questions sur des données visuelles

L'enrichissement des données est une étape courante après la génération de texte. Il consiste à enrichir les insights de l'analyse initiale en les combinant à des données supplémentaires. Par exemple, vous pouvez analyser des images d'articles de décoration intérieure pour générer du texte pour une colonne design_type, afin que le code SKU des articles de décoration ait une description associée, comme mid-century modern ou farmhouse.

Modèles compatibles

Pour effectuer des tâches d'IA générative, vous pouvez utiliser des modèles distants dans BigQuery ML pour faire référence à des modèles déployés ou hébergés dans Vertex AI. Vous pouvez créer les types de modèles distants suivants:

Modèles distants sur l'un des modèles Gemini généralement disponibles ou preview.
Modèles distants sur les modèles partenaires suivants:
Modèles distants sur des modèles ouverts compatibles.

Utiliser des modèles de génération de texte

Après avoir créé un modèle distant, vous pouvez utiliser la fonction ML.GENERATE_TEXT pour interagir avec ce modèle:

Pour les modèles distants basés sur des modèles Gemini, vous pouvez effectuer les opérations suivantes:
- Utilisez la fonction ML.GENERATE_TEXT pour générer du texte à partir d'une invite que vous spécifiez dans une requête ou extrayez d'une colonne d'un tableau standard. Lorsque vous spécifiez l'invite dans une requête, vous pouvez faire référence aux types de colonnes de table suivants dans l'invite:
  - des colonnes STRING pour fournir des données textuelles.
  - Colonnes STRUCT qui utilisent le format ObjectRef pour fournir des données non structurées. Vous devez utiliser la fonction OBJ.GET_ACCESS_URL dans l'invite pour convertir les valeurs ObjectRef en valeurs ObjectRefRuntime.
- Utilisez la fonction ML.GENERATE_TEXT pour analyser le contenu texte, image, audio, vidéo ou PDF d'une table d'objets à l'aide d'une invite que vous fournissez en tant qu'argument de fonction.
Pour tous les autres types de modèles distants, vous pouvez utiliser la fonction ML.GENERATE_TEXT avec une invite que vous fournissez dans une requête ou à partir d'une colonne d'une table standard.

Utilisez les sujets suivants pour essayer la génération de texte dans BigQuery ML:

Attributs de mise à la terre et de sécurité

Vous pouvez utiliser la mise à la terre et les attributs de sécurité lorsque vous utilisez des modèles Gemini avec la fonction ML.GENERATE_TEXT, à condition d'utiliser une table standard pour la saisie. L'ancrage permet au modèle Gemini d'utiliser des informations supplémentaires provenant d'Internet pour générer des réponses plus spécifiques et factuelles. Les attributs de sécurité permettent au modèle Gemini de filtrer les réponses qu'il renvoie en fonction des attributs que vous spécifiez.

Réglage supervisé

Lorsque vous créez un modèle distant qui fait référence à l'un des modèles suivants, vous pouvez éventuellement choisir de configurer le réglage supervisé simultanément:

gemini-2.0-flash-001
gemini-2.0-flash-lite-001
gemini-1.5-pro-002
gemini-1.5-flash-002

Toutes les inférences s'effectuent dans Vertex AI. Les résultats sont stockés dans BigQuery.

Débit provisionné Vertex AI

Pour les modèles Gemini compatibles, vous pouvez utiliser le débit provisionné Vertex AI avec la fonction ML.GENERATE_TEXT pour fournir un débit élevé et cohérent pour les requêtes. Pour en savoir plus, consultez la section Utiliser le débit provisionné Vertex AI.

Générer des données structurées

La génération de données structurées est très semblable à la génération de texte, mais vous pouvez également mettre en forme la réponse du modèle en spécifiant un schéma SQL.

Pour générer des données structurées, créez un modèle distant sur l'un des modèles Gemini généralement disponibles ou en preview. Vous pouvez ensuite utiliser la fonction AI.GENERATE_TABLE pour interagir avec ce modèle. Pour essayer de créer des données structurées, consultez la section Générer des données structurées à l'aide de la fonction AI.GENERATE_TABLE.

Vous pouvez spécifier des attributs de sécurité lorsque vous utilisez des modèles Gemini avec la fonction AI.GENERATE_TABLE afin de filtrer les réponses du modèle.

Générer des valeurs d'un type spécifique par ligne

Vous pouvez utiliser des fonctions d'IA générative scalaire avec des modèles Gemini pour analyser les données dans des tables standards BigQuery. Les données incluent à la fois des données textuelles et des données non structurées provenant de colonnes contenant des valeurs ObjectRef. Pour chaque ligne du tableau, ces fonctions génèrent une sortie contenant un type spécifique.

Les fonctions d'IA suivantes sont disponibles:

AI.GENERATE, qui génère une valeur STRING
AI.GENERATE_BOOL
AI.GENERATE_DOUBLE
AI.GENERATE_INT

Lorsque vous utilisez la fonction AI.GENERATE avec des modèles Gemini compatibles, vous pouvez utiliser le débit provisionné Vertex AI pour fournir un débit élevé et cohérent pour les requêtes. Pour en savoir plus, consultez la section Utiliser le débit provisionné Vertex AI.

Générer des embeddings

Un embedding est un vecteur numérique de grande dimension qui représente une entité donnée, comme un exemple de texte ou un fichier audio. Générer des représentations vectorielles continues vous permet de capturer la sémantique de vos données de manière à faciliter la réflexion et la comparaison des données.

Voici quelques cas d'utilisation courants de la génération d'embeddings:

Utilisation de la génération augmentée par récupération (RAG) pour améliorer les réponses du modèle aux requêtes des utilisateurs en référençant des données supplémentaires provenant d'une source fiable. Le RAG offre une meilleure précision factuelle et une plus grande cohérence des réponses, et permet également d'accéder à des données plus récentes que les données d'entraînement du modèle.
Effectuer une recherche multimodale Par exemple, en utilisant la saisie de texte pour rechercher des images.
Effectuer une recherche sémantique pour trouver des éléments similaires à des fins de recommandation, de substitution et de déduplication des enregistrements.
Créer des représentations vectorielles continues à utiliser avec un modèle de clustering en k-moyennes

Modèles compatibles

Les modèles suivants sont acceptés :

Pour créer des représentations vectorielles continues de texte, vous pouvez utiliser les modèles text-embedding et text-multilingual-embedding de Vertex AI.
Pour créer des embeddings multimodaux, qui peuvent incorporer du texte, des images et des vidéos dans le même espace sémantique, vous pouvez utiliser le modèle multimodalembedding de Vertex AI.
Pour créer des représentations vectorielles continues pour des données de variables indépendantes et identiquement distribuées (IID), vous pouvez utiliser un modèle d'analyse des composants principaux (ACP) BigQuery ML ou un modèle auto-encodeur.
Pour créer des représentations vectorielles continues pour des données utilisateur ou d'éléments, vous pouvez utiliser un modèle de factorisation matricielle BigQuery ML.

Pour obtenir un embedding textuel plus petit, essayez d'utiliser un modèle TensorFlow pré-entraîné tel que NNLM, SWIVEL ou BERT.

Utiliser des modèles de génération d'embeddings

Après avoir créé le modèle, vous pouvez utiliser la fonction ML.GENERATE_EMBEDDING pour interagir avec lui. Pour tous les types de modèles compatibles, ML.GENERATE_EMBEDDING fonctionne avec les données structurées des tables standards. Pour les modèles d'embedding multimodaux, ML.GENERATE_EMBEDDING fonctionne également avec le contenu visuel à partir de colonnes de table standards contenant des valeurs ObjectRef ou de tables d'objets.

Pour les modèles distants, toutes les inférences ont lieu dans Vertex AI. Pour les autres types de modèles, toutes les inférences ont lieu dans BigQuery. Les résultats sont stockés dans BigQuery.

Utilisez les sujets suivants pour essayer la génération de texte dans BigQuery ML:

Prévision

La prévision est une technique qui vous permet d'analyser les données historiques des séries temporelles afin de réaliser une prédiction avisée sur les tendances futures. Vous pouvez utiliser le modèle de séries temporelles TimesFM intégré de BigQuery ML (Preview) pour effectuer des prévisions sans avoir à créer votre propre modèle. Le modèle TimesFM intégré fonctionne avec la fonction AI.FORECAST pour générer des prévisions en fonction de vos données.

Emplacements

Les emplacements compatibles pour les modèles de génération de texte et d'embedding varient en fonction du type et de la version de modèle que vous utilisez. Pour en savoir plus, consultez la section Emplacements. Contrairement aux autres modèles d'IA générative, la prise en charge des emplacements ne s'applique pas au modèle de série temporelle TimesFM intégré. Le modèle TimesFM est disponible dans toutes les régions compatibles avec BigQuery.

Tarifs

Les ressources de calcul que vous utilisez pour exécuter des requêtes sur des modèles vous sont facturées. Les modèles distants appellent des modèles Vertex AI. Par conséquent, les requêtes adressées à des modèles distants sont également facturées par Vertex AI.

Pour en savoir plus, consultez la page Tarifs de BigQuery ML.

Étapes suivantes

Pour en savoir plus sur l'IA et le ML dans BigQuery, consultez la page Présentation de l'IA et du ML dans BigQuery.
Pour en savoir plus sur l'exécution d'inférences sur des modèles de machine learning, consultez la page Présentation de l'inférence de modèle.