GSP1272

Présentation
Dans cet atelier, vous découvrirez comment utiliser l'API Gemini dans Vertex AI pour générer des données synthétiques à l'aide de Snowfakery. Snowfakery est un framework puissant servant à créer des données complexes factices, et Gemini améliore ce processus grâce à ses fonctionnalités de traitement du langage naturel. Vous apprendrez à définir des stratégies de génération de données, à utiliser des schémas prédéfinis et à générer différents formats de données (comme des blogs et des commentaires) à partir d'une page Wikipédia. C'est une approche utile pour effectuer des tests, faire des expérimentations avec des requêtes et créer des exemples few-shot.
Prérequis
Avant de commencer cet atelier, vous devez :
- avoir des connaissances de base en programmation Python ;
- connaître les concepts généraux sur les API ;
- savoir exécuter du code Python dans un notebook Jupyter dans Vertex AI Workbench.
Objectifs
Au cours de cet atelier, vous allez :
- interagir avec l'API Gemini à l'aide du SDK Vertex AI pour Python ;
- utiliser Snowfakery pour définir des schémas et des stratégies de génération de données ;
- utiliser Gemini pour générer des données synthétiques dans différents formats ;
- découvrir des applications concrètes de la génération de données synthétiques, par exemple pour effectuer des tests et faire des expérimentations avec des requêtes.
Préparation
Avant de cliquer sur le bouton "Démarrer l'atelier"
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
- Vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome).
Remarque : Ouvrez une fenêtre de navigateur en mode incognito (recommandé) ou de navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
- Vous disposez d'un temps limité. N'oubliez pas qu'une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Remarque : Utilisez uniquement le compte de participant pour cet atelier. Si vous utilisez un autre compte Google Cloud, des frais peuvent être facturés à ce compte.
Démarrer l'atelier et se connecter à la console Google Cloud
-
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, une boîte de dialogue s'affiche pour vous permettre de sélectionner un mode de paiement.
Sur la gauche, vous trouverez le panneau "Détails concernant l'atelier", qui contient les éléments suivants :
- Le bouton "Ouvrir la console Google Cloud"
- Le temps restant
- Les identifiants temporaires que vous devez utiliser pour cet atelier
- Des informations complémentaires vous permettant d'effectuer l'atelier
-
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).
L'atelier lance les ressources, puis ouvre la page "Se connecter" dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte.
-
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
{{{user_0.username | "Username"}}}
Vous trouverez également le nom d'utilisateur dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
-
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
{{{user_0.password | "Password"}}}
Vous trouverez également le mot de passe dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
Important : Vous devez utiliser les identifiants fournis pour l'atelier. Ne saisissez pas ceux de votre compte Google Cloud.
Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés.
-
Accédez aux pages suivantes :
- Acceptez les conditions d'utilisation.
- N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
- Ne vous inscrivez pas à des essais sans frais.
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Remarque : Pour accéder aux produits et services Google Cloud, cliquez sur le menu de navigation ou saisissez le nom du service ou du produit dans le champ Recherche.
Tâche 1 : Ouvrir le notebook dans Vertex AI Workbench
-
Dans la console Google Cloud, accédez au menu de navigation (
) et cliquez sur Vertex AI > Workbench.
-
Recherchez l'instance , puis cliquez sur le bouton Ouvrir JupyterLab.
L'interface JupyterLab de votre instance Workbench s'ouvre dans un nouvel onglet de navigateur.
Tâche 2 : Configurer le notebook
-
Ouvrez le fichier .
-
Dans la boîte de dialogue Select Kernel (Sélectionner le kernel), sélectionnez Python 3 dans la liste des kernels disponibles.
-
Parcourez les sections Getting Started (Premiers pas) et Import libraries (Importer des bibliothèques) du notebook.
- Pour Project ID (ID du projet), utilisez et pour Location (Emplacement), utilisez .
Remarque : Vous pouvez ignorer les cellules du notebook avec la mention Colab only (Colab uniquement). Si l'exécution d'une cellule renvoie l'erreur 429, patientez une minute avant de la réexécuter pour poursuivre.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Installer les packages et importer les bibliothèques
Tâche 3 : Créer des plug-ins et des requêtes
Dans cette tâche, vous allez créer les deux plug-ins personnalisés requis pour ce cas d'utilisation, ainsi que les requêtes nécessaires. Le premier plug-in vous permet d'interagir avec Wikipedia et d'extraire le contenu d'une page donnée. Le deuxième plug-in vous permet d'interagir avec l'API Gemini.
- Parcourez la section Créer des plug-ins et des requêtes du notebook.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Créer des plug-ins et des requêtes
Tâche 4 : Créer la recette
Pour générer des données synthétiques, vous devez d'abord définir le schéma de ces données. Pour cela, vous devez créer une recette
au format YAML, comme illustré dans le notebook. Pour en savoir plus sur la création de recettes, cliquez ici. Dans cette tâche, vous allez définir le schéma des données générées de manière synthétique.
- Parcourez la section Créer la recette du notebook.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Créer la recette
Tâche 5 : Générer des données
Dans cette tâche, vous allez générer les données et afficher les résultats dans le dossier /outputs
.
- Parcourez la section Générer des données du notebook.
Remarque : Cette étape peut prendre plusieurs minutes.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Générer des données
Félicitations !
Félicitations ! Dans cet atelier, vous avez interagi avec l'API Gemini à l'aide du SDK Vertex AI pour Python, ce qui vous a permis de constater sa capacité à générer des données synthétiques. En utilisant Snowfakery pour définir des schémas et des stratégies de génération de données, vous avez pu personnaliser le résultat pour répondre à des exigences spécifiques. Vous avez également découvert la polyvalence de Gemini pour produire des données synthétiques dans différents formats, et son potentiel pour des applications concrètes comme effectuer des tests et expérimenter avec des requêtes.
Étapes suivantes et informations supplémentaires
Consultez les ressources suivantes pour en savoir plus sur Gemini :
Formations et certifications Google Cloud
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 28 mai 2025
Dernier test de l'atelier : 28 mai 2025
Copyright 2025 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.