GSP1334
Présentation
Imaginons que vous souhaitiez lancer une recherche dans un catalogue d'images
de produits stockées dans Cloud Storage pour déterminer si un produit
similaire a déjà été vendu. Pour ce faire, vous pouvez utiliser la recherche
vectorielle dans BigQuery.
BigQuery est
une plate-forme de données entièrement gérée et compatible avec l'IA. Elle
permet d'intégrer facilement des sources de données externes (comme les
métadonnées des images d'un bucket Cloud Storage) et de se connecter à des
modèles distants pour la recherche vectorielle. Vous pouvez ainsi améliorer
vos workflows d'analyse de données grâce à l'IA générative.
La
recherche vectorielle
est une méthode qui permet de trouver rapidement des éléments similaires en
fonction de leur signification sémantique (plutôt que de la correspondance
exacte des mots clés). Elle peut être appliquée à de nombreux types de
données, y compris les images, les vidéos et le texte. Elle utilise des
embeddings, qui sont des vecteurs numériques de grande dimension représentant
une entité, comme du texte ou une image. Ces embeddings encodent la sémantique
de ces entités afin de faciliter leur comparaison. Cette méthode est utile
dans de nombreux cas, par exemple pour rechercher plus facilement des articles
similaires déjà vendus dans un ensemble de données d'inventaire ou un
catalogue d'images de produits.
À partir du nom ou de la description d'un produit, vous pouvez utiliser la
recherche vectorielle sur une table d'objets BigQuery contenant les
métadonnées des images de produits. Vous pourrez ainsi identifier les produits
les plus étroitement liés à vos termes de recherche. Ce workflow intègre la
puissance de
Agent Platform
à BigQuery pour la recherche vectorielle. De cette façon, vous pouvez analyser
des données multimodales (y compris des images et du texte) dans BigQuery afin
d'extraire des insights pratiques, ce qui améliore vos capacités de prise de
décision.
Dans cet atelier, nous allons vous présenter rapidement le fonctionnement de
la recherche vectorielle multimodale dans BigQuery. Vous commencerez par
accorder des autorisations et créer une connexion à un modèle d'embeddings
dans BigQuery. Vous appellerez ensuite le modèle pour générer une table
d'embeddings permettant de stocker les représentations vectorielles des images
de produits dans un bucket Cloud Storage. Enfin, vous effectuerez une
recherche vectorielle sur les images de produits stockées dans Cloud Storage
pour identifier les produits qui correspondent le plus à vos termes de
recherche en fonction des caractéristiques et des métadonnées des images.
Objectifs de l'atelier
Dans cet atelier, vous allez apprendre à effectuer les tâches suivantes :
-
Attribuer des rôles Identity and Access Management (IAM) au compte de
service BigQuery
- Se connecter à un modèle d'embeddings distant dans BigQuery
- Générer des embeddings et les enregistrer dans une table BigQuery
-
Effectuer une recherche vectorielle sur les images de produits dans
Cloud Storage
Préparation
Avant de cliquer sur le bouton "Démarrer l'atelier"
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
- Vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome).
Remarque : Ouvrez une fenêtre de navigateur en mode incognito (recommandé) ou de navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
- Vous disposez d'un temps limité. N'oubliez pas qu'une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Remarque : Utilisez uniquement le compte de participant pour cet atelier. Si vous utilisez un autre compte Google Cloud, des frais peuvent être facturés à ce compte.
Démarrer l'atelier et se connecter à la console Google Cloud
-
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, une boîte de dialogue s'affiche pour vous permettre de sélectionner un mode de paiement.
Sur la gauche, vous trouverez le panneau "Détails concernant l'atelier", qui contient les éléments suivants :
- Le bouton "Ouvrir la console Google Cloud"
- Le temps restant
- Les identifiants temporaires que vous devez utiliser pour cet atelier
- Des informations complémentaires vous permettant d'effectuer l'atelier
-
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).
L'atelier lance les ressources, puis ouvre la page "Se connecter" dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte.
-
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
{{{user_0.username | "Username"}}}
Vous trouverez également le nom d'utilisateur dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
-
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
{{{user_0.password | "Password"}}}
Vous trouverez également le mot de passe dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
Important : Vous devez utiliser les identifiants fournis pour l'atelier. Ne saisissez pas ceux de votre compte Google Cloud.
Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés.
-
Accédez aux pages suivantes :
- Acceptez les conditions d'utilisation.
- N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
- Ne vous inscrivez pas à des essais sans frais.
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Remarque : Pour accéder aux produits et services Google Cloud, cliquez sur le menu de navigation ou saisissez le nom du service ou du produit dans le champ Recherche.
Tâche 1 : Attribuer des rôles IAM au compte de service BigQuery
Dans cet environnement d'atelier, plusieurs ressources ont été précréées, y
compris une
connexion externe BigQuery
nommée remote-models-connection et une
table d'objets BigQuery
appelée image_object_table. Ces ressources vous permettent
d'accéder aux données non structurées dans Cloud Storage (comme les images) et
de les interroger. Lors de la création de la connexion externe, un compte de
service BigQuery a également été généré automatiquement. Il peut servir à
contrôler l'accès aux ressources.
Dans cette tâche, vous allez attribuer des rôles IAM spécifiques au compte de
service BigQuery généré automatiquement pour accéder aux fichiers image dans
Cloud Storage et aux ressources Agent Platform nécessaires à la recherche
vectorielle.
Ouvrir la console BigQuery
- Dans la console Google Cloud, sélectionnez le menu de navigation > BigQuery.
Le message Bienvenue sur BigQuery dans Cloud Console s'affiche. Il contient un lien vers le guide de démarrage rapide et les notes de version.
- Cliquez sur OK.
La console BigQuery s'ouvre.
Identifier le compte de service BigQuery généré automatiquement
-
Cliquez sur la flèche à côté de l'ID du projet (), puis sur celle à côté de Connexions.
-
Cliquez sur la connexion nommée
.remote-models-connection.
-
Sur la page Informations de connexion, copiez l'ID du compte de service
que vous utiliserez à l'étape suivante.
Par exemple :
bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com
Attribuer des rôles IAM au compte de service BigQuery
-
Dans la console Google Cloud, accédez au
menu de navigation (
), puis sélectionnez IAM et administration >
IAM.
-
Cliquez sur Accorder l'accès.
-
Dans le champ Nouveaux comptes principaux, saisissez l'ID
du compte de service que vous avez copié dans la section précédente (par
exemple,
bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com).
-
Dans le champ Sélectionner un rôle, appliquez le filtre
Utilisateur Agent Platform, puis sélectionnez-le dans les
résultats.
-
Cliquez sur Ajouter un autre rôle.
-
Dans le champ Sélectionner un rôle, appliquez le filtre
Lecteur d'objets Storage, puis sélectionnez-le dans les
résultats.
-
Cliquez sur Enregistrer.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Attribuer des rôles IAM au compte de service BigQuery
Tâche 2 : Créer un modèle distant BigQuery
Maintenant que vous avez attribué les rôles nécessaires au compte de service
BigQuery, vous pouvez créer un
modèle distant dans BigQuery
pour accéder aux fonctionnalités de Agent Platform, comme celles d'IA
générative.
Dans cette tâche, vous allez utiliser la connexion externe BigQuery nommée
remote-models-connection pour créer un modèle distant nommé
embeddings_model qui se connecte à un modèle d'embeddings
disponible dans Agent Platform. Comme vos données d'images sont stockées dans
un bucket Cloud Storage dans un format non structuré, vous devez désigner un
modèle multimodal comme point de terminaison pour gérer efficacement ce type
de données.
-
Dans la console Google Cloud, accédez au
menu de navigation (
), puis sélectionnez BigQuery >
Studio.
-
Dans la fenêtre de requête SQL, collez la requête SQL suivante pour créer
le modèle distant BigQuery dans l'ensemble de données BigQuery existant
nommé products, puis cliquez sur
Exécuter :
CREATE OR REPLACE MODEL
`{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`
REMOTE WITH CONNECTION `{{{project_0.project_id | filled in at lab start}}}.{{{project_0.startup_script.bq_gcp_region | "BigQuery location"}}}.remote-models-connection`
OPTIONS(
ENDPOINT = '{{{project_0.startup_script.multi_modal_embedding_id | Multimodal embeddings model}}}'
);
Remarque : Si vous recevez une erreur liée aux autorisations du compte de service (que vous avez attribuées lors de la tâche précédente), patientez quelques minutes, puis exécutez à nouveau la requête.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Créer un modèle distant BigQuery
Tâche 3 : Créer une table d'embeddings pour les images listées dans une table
d'objets
Une fois le modèle distant créé dans BigQuery, vous devez l'appeler pour
générer les embeddings à partir des fichiers image stockés dans Cloud Storage.
Comme indiqué dans la tâche 1, une
table d'objets
nommée image_object_table a été précréée pour cet
environnement d'atelier et peut servir à interroger les fichiers image.
Dans cette tâche, vous allez appeler le modèle d'embeddings pour l'exécuter
sur product_image_object_table et stocker les résultats dans
une nouvelle table nommée product_embeddings. Lors de
l'exécution de la requête, BigQuery envoie les données de la table d'objets au
modèle d'embeddings multimodaux, qui renvoie les embeddings pouvant être utilisés pour les recherches
vectorielles afin de trouver des entités sémantiquement similaires.
-
Dans la fenêtre de requête SQL, exécutez la requête SQL suivante pour créer
la table d'embeddings :
CREATE OR REPLACE TABLE `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`
AS SELECT *, REGEXP_EXTRACT(uri, r'[^/]+$') as product_name
FROM ML.GENERATE_EMBEDDING
(
MODEL `{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`,
TABLE `{{{project_0.project_id | filled in at lab start}}}.products.image_object_table`
);
-
Dans la fenêtre de requête SQL, exécutez la requête suivante pour examiner
les données de la nouvelle table d'embeddings :
SELECT * FROM `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`;
Cliquez sur Vérifier ma progression pour valider l'objectif.
Créer une table d'embeddings pour les images listées dans une table
d'objets
Tâche 4 : Effectuer une recherche vectorielle sur les images de produits dans
Cloud Storage
Comme indiqué dans la présentation de cet atelier, la
recherche vectorielle
dans BigQuery vous permet d'utiliser des embeddings calculés (qui sont des
vecteurs numériques) pour trouver des objets sémantiquement similaires. Plus
précisément, elle utilise des métriques de distance qui représentent la
distance entre les vecteurs dans un espace d'embeddings pour les comparer et
les classer selon leur similarité. Dans BigQuery, la fonction de recherche
vectorielle est compatible avec trois
types de distance : la distance euclidienne (par défaut), la distance de cosinus et la
distance de produit scalaire.
Dans cette tâche, vous allez utiliser la similarité cosinus (c'est-à-dire le
cosinus de l'angle entre deux vecteurs) pour identifier les trois images de
produits dans Google Cloud Storage qui correspondent le plus à une expression
de recherche spécifique : pulls colorés pour femmes.
-
Dans la fenêtre de requête SQL, exécutez la requête suivante qui utilise la
fonction
VECTOR_SEARCH pour interroger la table d'embeddings de
produits et trouver les images qui correspondent le plus au terme de
recherche fourni :
SELECT base.uri,
base.product_name,
base.content_type,
distance
FROM
VECTOR_SEARCH(TABLE products.product_embeddings,'ml_generate_embedding_result',
(
SELECT ml_generate_embedding_result AS embedding_col
FROM
ML.GENERATE_EMBEDDING
(
MODEL `products.embeddings_model`,
(SELECT 'colorful sweaters for women' AS content),
STRUCT(TRUE AS flatten_json_output)
)
),
TOP_K => 3,
DISTANCE_TYPE => 'COSINE'
);
Examiner les images qui correspondent le plus dans Cloud Storage
[Facultatif] Pour voir les images spécifiques qui ont été renvoyées comme
étant celles qui correspondent le plus, vous pouvez accéder au bucket
Cloud Storage et ouvrir chaque image.
-
Dans la console Google Cloud, accédez au
menu de navigation (
), sélectionnez Cloud Storage >
Buckets.
-
Cliquez sur le bucket nommé
, puis sur le nom d'une image (par exemple, Onesie.jpg).
-
Cliquez sur l'URL authentifiée pour afficher l'image (par
exemple,
https://storage.cloud.google.com/qwiklabs-gcp-04-dc2812426125/Onesie.jpg).
Cliquez sur Vérifier ma progression pour valider l'objectif.
Effectuer une recherche vectorielle sur des images de produits dans
Cloud Storage
Félicitations !
Dans cet atelier, nous vous avons présenté rapidement la recherche vectorielle
dans BigQuery et vous l'avez utilisée pour trouver dans Cloud Storage les
images qui correspondaient le plus à un terme de recherche donné.
Étapes suivantes et informations supplémentaires
Formations et certifications Google Cloud
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 16 mars 2026
Dernier test de l'atelier : 16 mars 2026
Copyright 2026 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.