GSP1334
Présentation
Imaginons que vous souhaitiez lancer une recherche dans un catalogue d'images de produits stockées dans Cloud Storage pour déterminer si un produit similaire a déjà été vendu. Pour ce faire, vous pouvez utiliser la recherche vectorielle dans BigQuery.
BigQuery est une plate-forme de données entièrement gérée et compatible avec l'IA. Elle permet d'intégrer facilement des sources de données externes (comme les métadonnées des images d'un bucket Cloud Storage) et de se connecter à des modèles distants pour la recherche vectorielle. Vous pouvez ainsi améliorer vos workflows d'analyse de données grâce à l'IA générative.
La recherche vectorielle est une méthode qui permet de trouver rapidement des éléments similaires en fonction de leur signification sémantique (plutôt que de la correspondance exacte des mots clés). Elle peut être appliquée à de nombreux types de données, y compris les images, les vidéos et le texte. Elle utilise des embeddings, qui sont des vecteurs numériques de grande dimension représentant une entité, comme du texte ou une image. Ces embeddings encodent la sémantique de ces entités afin de faciliter leur comparaison. Cette méthode est utile dans de nombreux cas, par exemple pour rechercher plus facilement des articles similaires déjà vendus dans un ensemble de données d'inventaire ou un catalogue d'images de produits.
À partir du nom ou de la description d'un produit, vous pouvez utiliser la recherche vectorielle sur une table d'objets BigQuery contenant les métadonnées des images de produits. Vous pourrez ainsi identifier les produits les plus étroitement liés à vos termes de recherche. Ce workflow intègre la puissance de Vertex AI à BigQuery pour la recherche vectorielle. De cette façon, vous pouvez analyser des données multimodales (y compris des images et du texte) dans BigQuery afin d'extraire des insights pratiques, ce qui améliore vos capacités de prise de décision.
Dans cet atelier, nous allons vous présenter rapidement le fonctionnement de la recherche vectorielle multimodale dans BigQuery. Vous commencerez par accorder des autorisations et créer une connexion à un modèle d'embeddings dans BigQuery. Vous appellerez ensuite le modèle pour générer une table d'embeddings permettant de stocker les représentations vectorielles des images de produits dans un bucket Cloud Storage. Enfin, vous effectuerez une recherche vectorielle sur les images de produits stockées dans Cloud Storage pour identifier les produits qui correspondent le plus à vos termes de recherche en fonction des caractéristiques et des métadonnées des images.
Objectifs de l'atelier
Dans cet atelier, vous allez apprendre à effectuer les tâches suivantes :
- Attribuer des rôles Identity and Access Management (IAM) au compte de service BigQuery
- Se connecter à un modèle d'embeddings distant dans BigQuery
- Générer des embeddings et les enregistrer dans une table BigQuery
- Effectuer une recherche vectorielle sur les images de produits dans Cloud Storage
Préparation
Avant de cliquer sur le bouton "Démarrer l'atelier"
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
- Vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome).
Remarque : Ouvrez une fenêtre de navigateur en mode incognito (recommandé) ou de navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
- Vous disposez d'un temps limité. N'oubliez pas qu'une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Remarque : Utilisez uniquement le compte de participant pour cet atelier. Si vous utilisez un autre compte Google Cloud, des frais peuvent être facturés à ce compte.
Démarrer l'atelier et se connecter à la console Google Cloud
-
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, une boîte de dialogue s'affiche pour vous permettre de sélectionner un mode de paiement.
Sur la gauche, vous trouverez le panneau "Détails concernant l'atelier", qui contient les éléments suivants :
- Le bouton "Ouvrir la console Google Cloud"
- Le temps restant
- Les identifiants temporaires que vous devez utiliser pour cet atelier
- Des informations complémentaires vous permettant d'effectuer l'atelier
-
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).
L'atelier lance les ressources, puis ouvre la page "Se connecter" dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte.
-
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
{{{user_0.username | "Username"}}}
Vous trouverez également le nom d'utilisateur dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
-
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
{{{user_0.password | "Password"}}}
Vous trouverez également le mot de passe dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
Important : Vous devez utiliser les identifiants fournis pour l'atelier. Ne saisissez pas ceux de votre compte Google Cloud.
Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés.
-
Accédez aux pages suivantes :
- Acceptez les conditions d'utilisation.
- N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
- Ne vous inscrivez pas à des essais sans frais.
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Remarque : Pour accéder aux produits et services Google Cloud, cliquez sur le menu de navigation ou saisissez le nom du service ou du produit dans le champ Recherche.
Tâche 1 : Attribuer des rôles IAM au compte de service BigQuery
Dans cet environnement d'atelier, plusieurs ressources ont été précréées, y compris une connexion externe BigQuery nommée remote-models-connection et une table d'objets BigQuery appelée image_object_table. Ces ressources vous permettent d'accéder aux données non structurées dans Cloud Storage (comme les images) et de les interroger. Lors de la création de la connexion externe, un compte de service BigQuery a également été généré automatiquement. Il peut servir à contrôler l'accès aux ressources.
Dans cette tâche, vous allez attribuer des rôles IAM spécifiques au compte de service BigQuery généré automatiquement pour accéder aux fichiers image dans Cloud Storage et aux ressources Vertex AI nécessaires à la recherche vectorielle.
Ouvrir la console BigQuery
- Dans la console Google Cloud, sélectionnez le menu de navigation > BigQuery.
Le message Bienvenue sur BigQuery dans Cloud Console s'affiche. Il contient un lien vers le guide de démarrage rapide et les notes de version.
- Cliquez sur OK.
La console BigQuery s'ouvre.
Identifier le compte de service BigQuery généré automatiquement
-
Cliquez sur la flèche à côté de l'ID du projet (), puis sur celle à côté de Connexions.
-
Cliquez sur la connexion nommée .remote-models-connection.
-
Sur la page Informations de connexion, copiez l'ID du compte de service que vous utiliserez à l'étape suivante.
Par exemple : bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com
Attribuer des rôles IAM au compte de service BigQuery
-
Dans la console Google Cloud, accédez au menu de navigation (
), puis sélectionnez IAM et administration > IAM.
-
Cliquez sur Accorder l'accès.
-
Dans le champ Nouveaux comptes principaux, saisissez l'ID du compte de service que vous avez copié dans la section précédente (par exemple, bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com).
-
Dans le champ Sélectionner un rôle, appliquez le filtre Utilisateur Vertex AI, puis sélectionnez-le dans les résultats.
-
Cliquez sur Ajouter un autre rôle.
-
Dans le champ Sélectionner un rôle, appliquez le filtre Lecteur d'objets Storage, puis sélectionnez-le dans les résultats.
-
Cliquez sur Enregistrer.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Attribuer des rôles IAM au compte de service BigQuery
Tâche 2 : Créer un modèle distant BigQuery
Maintenant que vous avez attribué les rôles nécessaires au compte de service BigQuery, vous pouvez créer un modèle distant dans BigQuery pour accéder aux fonctionnalités de Vertex AI, comme celles d'IA générative.
Dans cette tâche, vous allez utiliser la connexion externe BigQuery nommée remote-models-connection pour créer un modèle distant nommé embeddings_model qui se connecte à un modèle d'embeddings disponible dans Vertex AI. Comme vos données d'images sont stockées dans un bucket Cloud Storage dans un format non structuré, vous devez désigner un modèle multimodal comme point de terminaison pour gérer efficacement ce type de données.
-
Dans la console Google Cloud, accédez au menu de navigation (
), puis sélectionnez BigQuery > Studio.
-
Dans la fenêtre de requête SQL, collez la requête SQL suivante pour créer le modèle distant BigQuery dans l'ensemble de données BigQuery existant nommé products, puis cliquez sur Exécuter :
CREATE OR REPLACE MODEL
`{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`
REMOTE WITH CONNECTION `{{{project_0.project_id | filled in at lab start}}}.{{{project_0.startup_script.bq_gcp_region | "BigQuery location"}}}.remote-models-connection`
OPTIONS(
ENDPOINT = '{{{project_0.startup_script.multi_modal_embedding_id | Multimodal embeddings model}}}'
);
Remarque : Si vous recevez une erreur liée aux autorisations du compte de service (que vous avez attribuées lors de la tâche précédente), patientez quelques minutes, puis exécutez à nouveau la requête.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Créer un modèle distant BigQuery
Tâche 3 : Créer une table d'embeddings pour les images listées dans une table d'objets
Une fois le modèle distant créé dans BigQuery, vous devez l'appeler pour générer les embeddings à partir des fichiers image stockés dans Cloud Storage. Comme indiqué dans la tâche 1, une table d'objets nommée image_object_table a été précréée pour cet environnement d'atelier et peut servir à interroger les fichiers image.
Dans cette tâche, vous allez appeler le modèle d'embeddings pour l'exécuter sur product_image_object_table et stocker les résultats dans une nouvelle table nommée product_embeddings. Lors de l'exécution de la requête, BigQuery envoie les données de la table d'objets au modèle d'embeddings multimodaux, qui renvoie les embeddings pouvant être utilisés pour les recherches vectorielles afin de trouver des entités sémantiquement similaires.
- Dans la fenêtre de requête SQL, exécutez la requête SQL suivante pour créer la table d'embeddings :
CREATE OR REPLACE TABLE `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`
AS SELECT *, REGEXP_EXTRACT(uri, r'[^/]+$') as product_name
FROM ML.GENERATE_EMBEDDING
(
MODEL `{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`,
TABLE `{{{project_0.project_id | filled in at lab start}}}.products.image_object_table`
);
- Dans la fenêtre de requête SQL, exécutez la requête suivante pour examiner les données de la nouvelle table d'embeddings :
SELECT * FROM `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`;
Cliquez sur Vérifier ma progression pour valider l'objectif.
Créer une table d'embeddings pour les images listées dans une table d'objets
Tâche 4 : Effectuer une recherche vectorielle sur les images de produits dans Cloud Storage
Comme indiqué dans la présentation de cet atelier, la recherche vectorielle dans BigQuery vous permet d'utiliser des embeddings calculés (qui sont des vecteurs numériques) pour trouver des objets sémantiquement similaires. Plus précisément, elle utilise des métriques de distance qui représentent la distance entre les vecteurs dans un espace d'embeddings pour les comparer et les classer selon leur similarité. Dans BigQuery, la fonction de recherche vectorielle est compatible avec trois types de distance : la distance euclidienne (par défaut), la distance de cosinus et la distance de produit scalaire.
Dans cette tâche, vous allez utiliser la similarité cosinus (c'est-à-dire le cosinus de l'angle entre deux vecteurs) pour identifier les trois images de produits dans Google Cloud Storage qui correspondent le plus à une expression de recherche spécifique : pulls colorés pour femmes.
- Dans la fenêtre de requête SQL, exécutez la requête suivante qui utilise la fonction
VECTOR_SEARCH pour interroger la table d'embeddings de produits et trouver les images qui correspondent le plus au terme de recherche fourni :
SELECT base.uri,
base.product_name,
base.content_type,
distance
FROM
VECTOR_SEARCH(TABLE products.product_embeddings,'ml_generate_embedding_result',
(
SELECT ml_generate_embedding_result AS embedding_col
FROM
ML.GENERATE_EMBEDDING
(
MODEL `products.embeddings_model`,
(SELECT 'colorful sweaters for women' AS content),
STRUCT(TRUE AS flatten_json_output)
)
),
TOP_K => 3,
DISTANCE_TYPE => 'COSINE'
);
Examiner les images qui correspondent le plus dans Cloud Storage
[Facultatif] Pour voir les images spécifiques qui ont été renvoyées comme étant celles qui correspondent le plus, vous pouvez accéder au bucket Cloud Storage et ouvrir chaque image.
-
Dans la console Google Cloud, accédez au menu de navigation (
), sélectionnez Cloud Storage > Buckets.
-
Cliquez sur le bucket nommé , puis sur le nom d'une image (par exemple, Onesie.jpg).
-
Cliquez sur l'URL authentifiée pour afficher l'image (par exemple, https://storage.cloud.google.com/qwiklabs-gcp-04-dc2812426125/Onesie.jpg).
Cliquez sur Vérifier ma progression pour valider l'objectif.
Effectuer une recherche vectorielle sur des images de produits dans Cloud Storage
Félicitations !
Dans cet atelier, nous vous avons présenté rapidement la recherche vectorielle dans BigQuery et vous l'avez utilisée pour trouver dans Cloud Storage les images qui correspondaient le plus à un terme de recherche donné.
Étapes suivantes et informations supplémentaires
Formations et certifications Google Cloud
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 16 mars 2026
Dernier test de l'atelier : 16 mars 2026
Copyright 2026 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.