Accédez à plus de 700 ateliers et cours

Créer une application de reconnaissance d'image par l'IA à l'aide de Gemini sur Vertex AI

Atelier 15 minutes universal_currency_alt Sans frais show_chart Débutant
info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.
Accédez à plus de 700 ateliers et cours

Logo des ateliers d'auto-formation Google Cloud

Présentation

  • Les ateliers sont minutés et ne peuvent pas être mis en pause. Le minuteur démarre lorsque vous cliquez sur Démarrer l'atelier.
  • Le terminal cloud inclus est préconfiguré avec le SDK gcloud.
  • Utilisez le terminal pour exécuter les commandes, puis cliquez sur Vérifier ma progression pour que votre travail soit validé.

Objectif

L'IA générative sur Vertex AI vous donne accès aux grands modèles d'IA générative de Google. Vous pouvez ainsi les tester, les régler et les déployer pour les utiliser dans vos applications optimisées par l'IA. Au cours de cet atelier, vous allez :

  • Vous connecter à Vertex AI (plate-forme d'IA de Google Cloud) : découvrez comment établir une connexion aux services d'IA de Google à l'aide du SDK Vertex AI.
  • Charger un modèle d'IA générative pré-entraîné – Gemini : découvrez comment utiliser un modèle d'IA pré-entraîné performant sans avoir à le créer de toutes pièces.
  • Envoyer une image + une question sous forme de texte au modèle d'IA : apprenez à fournir à l'IA des données d'entrée à traiter.
  • Extraire des réponses textuelles de l'IA : apprenez à gérer et interpréter les réponses textuelles générées par le modèle d'IA.
  • Comprendre les bases de la création d'applications d'IA : explorez les concepts de base de l'intégration de l'IA dans les projets logiciels.

Utiliser le SDK Vertex AI pour Python

Une fois l'atelier démarré, deux volets s'affichent : l'éditeur de code à gauche et les instructions de l'atelier à droite. Suivez ces étapes pour exploiter les API Generative AI à l'aide du SDK Vertex AI pour Python.

  1. Cliquez sur Fichier > Nouveau fichier pour ouvrir un nouveau fichier dans l'éditeur de code.
  2. Copiez l'extrait de code fourni et collez-le dans votre fichier.
from google import genai from google.genai.types import HttpOptions, Part client = genai.Client(http_options=HttpOptions(api_version="v1")) response = client.models.generate_content( model="gemini-2.0-flash-001", contents=[ "What is shown in this image?", Part.from_uri( file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg", mime_type="image/jpeg", ), ], ) print(response.text)
  1. Cliquez sur Fichier > Enregistrer, saisissez genai.py dans le champ "Nom", puis cliquez sur Enregistrer.

  2. Pour définir les variables d'environnement dans le nouveau terminal, exécutez la commande suivante :

    export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}' export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}' export GOOGLE_GENAI_USE_VERTEXAI=True
  3. Saisissez la commande ci-dessous dans le terminal du volet "Éditeur de code" pour exécuter le fichier Python et afficher le résultat.

/usr/bin/python3 /genai.py Remarque : Si vous rencontrez une erreur 400, essayez de réexécuter le code.

Explication du code

  • L'extrait de code charge un modèle d'IA pré-entraîné appelé Gemini (gemini-2.0-flash-001) sur Vertex AI.
  • Le code appelle la méthode generate_content du modèle Gemini chargé.
  • Les données d'entrée sont un URI d'image et un prompt contenant une question sur l'image.
  • Le code utilise la capacité de Gemini à comprendre les images et le texte ensemble. Il utilise le texte fourni dans le prompt pour décrire le contenu de l'image.

Essayez vous-même ! Testez différents URI d'image et différentes questions prompt pour explorer les fonctionnalités de Gemini.

Cliquez sur Vérifier ma progression pour valider l'objectif.

Générer du contenu pour l'image

Félicitations !

Vous avez terminé l'atelier. Bravo !

Copyright 2025 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.

Avant de commencer

  1. Les ateliers créent un projet Google Cloud et des ressources pour une durée déterminée.
  2. Les ateliers doivent être effectués dans le délai imparti et ne peuvent pas être mis en pause. Si vous quittez l'atelier, vous devrez le recommencer depuis le début.
  3. En haut à gauche de l'écran, cliquez sur Démarrer l'atelier pour commencer.

Utilisez la navigation privée

  1. Copiez le nom d'utilisateur et le mot de passe fournis pour l'atelier
  2. Cliquez sur Ouvrir la console en navigation privée

Connectez-vous à la console

  1. Connectez-vous à l'aide des identifiants qui vous ont été attribués pour l'atelier. L'utilisation d'autres identifiants peut entraîner des erreurs ou des frais.
  2. Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
  3. Ne cliquez pas sur Terminer l'atelier, à moins que vous n'ayez terminé l'atelier ou que vous ne vouliez le recommencer, car cela effacera votre travail et supprimera le projet.

Ce contenu n'est pas disponible pour le moment

Nous vous préviendrons par e-mail lorsqu'il sera disponible

Parfait !

Nous vous contacterons par e-mail s'il devient disponible

Un atelier à la fois

Confirmez pour mettre fin à tous les ateliers existants et démarrer celui-ci

Utilisez la navigation privée pour effectuer l'atelier

Ouvrez une fenêtre de navigateur en mode navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.