Créer une application de reconnaissance d'image par l'IA à l'aide de Gemini sur Vertex AI
Atelier
15 minutes
universal_currency_alt
Sans frais
show_chart
Débutant
info
Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.
Accédez à plus de 700 ateliers et cours

Présentation
- Les ateliers sont minutés et ne peuvent pas être mis en pause. Le minuteur démarre lorsque vous cliquez sur Démarrer l'atelier.
- Le terminal cloud inclus est préconfiguré avec le SDK gcloud.
- Utilisez le terminal pour exécuter les commandes, puis cliquez sur Vérifier ma progression pour que votre travail soit validé.
Objectif
L'IA générative sur Vertex AI vous donne accès aux grands modèles d'IA générative de Google. Vous pouvez ainsi les tester, les régler et les déployer pour les utiliser dans vos applications optimisées par l'IA. Au cours de cet atelier, vous allez :
-
Vous connecter à Vertex AI (plate-forme d'IA de Google Cloud) : découvrez comment établir une connexion aux services d'IA de Google à l'aide du SDK Vertex AI.
-
Charger un modèle d'IA générative pré-entraîné – Gemini : découvrez comment utiliser un modèle d'IA pré-entraîné performant sans avoir à le créer de toutes pièces.
-
Envoyer une image + une question sous forme de texte au modèle d'IA : apprenez à fournir à l'IA des données d'entrée à traiter.
-
Extraire des réponses textuelles de l'IA : apprenez à gérer et interpréter les réponses textuelles générées par le modèle d'IA.
-
Comprendre les bases de la création d'applications d'IA : explorez les concepts de base de l'intégration de l'IA dans les projets logiciels.
Utiliser le SDK Vertex AI pour Python
Une fois l'atelier démarré, deux volets s'affichent : l'éditeur de code à gauche et les instructions de l'atelier à droite. Suivez ces étapes pour exploiter les API Generative AI à l'aide du SDK Vertex AI pour Python.
- Cliquez sur Fichier > Nouveau fichier pour ouvrir un nouveau fichier dans l'éditeur de code.
- Copiez l'extrait de code fourni et collez-le dans votre fichier.
from google import genai
from google.genai.types import HttpOptions, Part
client = genai.Client(http_options=HttpOptions(api_version="v1"))
response = client.models.generate_content(
model="gemini-2.0-flash-001",
contents=[
"What is shown in this image?",
Part.from_uri(
file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg",
mime_type="image/jpeg",
),
],
)
print(response.text)
-
Cliquez sur Fichier > Enregistrer, saisissez genai.py dans le champ "Nom", puis cliquez sur Enregistrer.
-
Pour définir les variables d'environnement dans le nouveau terminal, exécutez la commande suivante :
export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}'
export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}'
export GOOGLE_GENAI_USE_VERTEXAI=True
-
Saisissez la commande ci-dessous dans le terminal du volet "Éditeur de code" pour exécuter le fichier Python et afficher le résultat.
/usr/bin/python3 /genai.py
Remarque : Si vous rencontrez une erreur 400, essayez de réexécuter le code.
Explication du code
- L'extrait de code charge un modèle d'IA pré-entraîné appelé Gemini (gemini-2.0-flash-001) sur Vertex AI.
- Le code appelle la méthode
generate_content du modèle Gemini chargé.
- Les données d'entrée sont un URI d'image et un prompt contenant une question sur l'image.
- Le code utilise la capacité de Gemini à comprendre les images et le texte ensemble. Il utilise le texte fourni dans le prompt pour décrire le contenu de l'image.
Essayez vous-même ! Testez différents URI d'image et différentes questions prompt pour explorer les fonctionnalités de Gemini.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Générer du contenu pour l'image
Félicitations !
Vous avez terminé l'atelier. Bravo !
Copyright 2025 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.