Accédez à plus de 700 ateliers et cours

Créer une application de reconnaissance d'image par l'IA à l'aide de Gemini sur Vertex AI

Atelier 15 minutes universal_currency_alt Sans frais show_chart Débutant

info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.

Présentation
Objectif
Utiliser le SDK Vertex AI pour Python
Explication du code
Félicitations !

Accédez à plus de 700 ateliers et cours

Logo des ateliers d'auto-formation Google Cloud

Présentation

Les ateliers sont minutés et ne peuvent pas être mis en pause. Le minuteur démarre lorsque vous cliquez sur Démarrer l'atelier.
Le terminal cloud inclus est préconfiguré avec le SDK gcloud.
Utilisez le terminal pour exécuter les commandes, puis cliquez sur Vérifier ma progression pour que votre travail soit validé.

Objectif

L'IA générative sur Vertex AI vous donne accès aux grands modèles d'IA générative de Google. Vous pouvez ainsi les tester, les régler et les déployer pour les utiliser dans vos applications optimisées par l'IA. Au cours de cet atelier, vous allez :

Vous connecter à Vertex AI (plate-forme d'IA de Google Cloud) : découvrez comment établir une connexion aux services d'IA de Google à l'aide du SDK Vertex AI.
Charger un modèle d'IA générative pré-entraîné – Gemini : découvrez comment utiliser un modèle d'IA pré-entraîné performant sans avoir à le créer de toutes pièces.
Envoyer une image + une question sous forme de texte au modèle d'IA : apprenez à fournir à l'IA des données d'entrée à traiter.
Extraire des réponses textuelles de l'IA : apprenez à gérer et interpréter les réponses textuelles générées par le modèle d'IA.
Comprendre les bases de la création d'applications d'IA : explorez les concepts de base de l'intégration de l'IA dans les projets logiciels.

Utiliser le SDK Vertex AI pour Python

Une fois l'atelier démarré, deux volets s'affichent : l'éditeur de code à gauche et les instructions de l'atelier à droite. Suivez ces étapes pour exploiter les API Generative AI à l'aide du SDK Vertex AI pour Python.

Cliquez sur Fichier > Nouveau fichier pour ouvrir un nouveau fichier dans l'éditeur de code.
Copiez l'extrait de code fourni et collez-le dans votre fichier.

from google import genai from google.genai.types import HttpOptions, Part client = genai.Client(http_options=HttpOptions(api_version="v1")) response = client.models.generate_content( model="gemini-2.0-flash-001", contents=[ "What is shown in this image?", Part.from_uri( file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg", mime_type="image/jpeg", ), ], ) print(response.text)

Cliquez sur Fichier > Enregistrer, saisissez genai.py dans le champ "Nom", puis cliquez sur Enregistrer.
Pour définir les variables d'environnement dans le nouveau terminal, exécutez la commande suivante :
export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}' export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}' export GOOGLE_GENAI_USE_VERTEXAI=True
Saisissez la commande ci-dessous dans le terminal du volet "Éditeur de code" pour exécuter le fichier Python et afficher le résultat.

/usr/bin/python3 /genai.py

Remarque : Si vous rencontrez une erreur 400, essayez de réexécuter le code.

Explication du code

L'extrait de code charge un modèle d'IA pré-entraîné appelé Gemini (gemini-2.0-flash-001) sur Vertex AI.
Le code appelle la méthode generate_content du modèle Gemini chargé.
Les données d'entrée sont un URI d'image et un prompt contenant une question sur l'image.
Le code utilise la capacité de Gemini à comprendre les images et le texte ensemble. Il utilise le texte fourni dans le prompt pour décrire le contenu de l'image.

Essayez vous-même ! Testez différents URI d'image et différentes questions prompt pour explorer les fonctionnalités de Gemini.

Cliquez sur Vérifier ma progression pour valider l'objectif.

Générer du contenu pour l'image

Félicitations !

Vous avez terminé l'atelier. Bravo !

Copyright 2025 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.

Créer une application de reconnaissance d'image par l'IA à l'aide de Gemini sur Vertex AI

Présentation

Objectif

Utiliser le SDK Vertex AI pour Python

Explication du code

Félicitations !

Avant de commencer

Utilisez la navigation privée

Connectez-vous à la console

Utilisez la navigation privée pour effectuer l'atelier