Zugriff auf über 700 Labs und Kurse nutzen

Mit Gemini in Vertex AI eine Anwendung zur KI-Bilderkennung erstellen

Lab 15 Minuten universal_currency_alt Keine Kosten show_chart Einsteiger

info Dieses Lab kann KI-Tools enthalten, die den Lernprozess unterstützen.

Übersicht
Ziel
Mit dem Vertex AI Python SDK arbeiten
Erläuterung zum Code:
Glückwunsch!

Zugriff auf über 700 Labs und Kurse nutzen

Logo: Google Cloud-Labs zum selbstbestimmten Lernen

Übersicht

Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer beginnt zu laufen, wenn Sie auf Lab starten klicken.
Das enthaltene Cloud-Terminal ist mit dem gcloud SDK vorkonfiguriert.
Führen Sie Befehle über das Terminal aus und klicken Sie dann auf Fortschritt prüfen, um Ihre Arbeit zu überprüfen.

Ziel

Generative KI (auch als GenAI bezeichnet) in Vertex AI ermöglicht Ihnen Zugriff auf die großen generativen KI-Modelle von Google. So können Sie diese testen, abstimmen und in Ihren KI-basierten Anwendungen nutzen Aufgaben in diesem Lab:

Verbindung zu Vertex AI (KI-Plattform von Google Cloud) herstellen: Sie lernen, wie Sie mit dem Vertex AI SDK eine Verbindung zu den KI-Diensten von Google herstellen.
Vortrainiertes generatives KI-Modell laden – Gemini: Sie erfahren, wie Sie ein leistungsstarkes, vortrainiertes KI-Modell verwenden können, ohne es von Grund auf neu zu erstellen.
Bild- und Textfragen an das KI-Modell senden: Sie lernen, Eingaben bereitzustellen, die von der KI verarbeitet werden können.
Textbasierte Antworten aus der KI extrahieren: Sie erfahren, wie Sie die vom KI-Modell generierten Textantworten verarbeiten und interpretieren.
Grundlagen für das Erstellen von KI-Anwendungen: Sie erhalten Einblicke in die wichtigsten Konzepte für die Integration von KI in Softwareprojekte.

Mit dem Vertex AI Python SDK arbeiten

Wenn Sie das Lab starten, wird Ihnen eine Ansicht mit zwei Bereichen angezeigt: links sehen Sie den Code-Editor und rechts die Lab-Anleitung. Führen Sie folgende Schritte aus, um mithilfe des Vertex AI Python SDK mit den APIs für generative KI zu interagieren.

Klicken Sie auf Datei > Neue Datei, um eine neue Datei im Code-Editor zu öffnen.
Kopieren Sie das bereitgestellte Code-Snippet und fügen Sie es in die Datei ein.

from google import genai from google.genai.types import HttpOptions, Part client = genai.Client(http_options=HttpOptions(api_version="v1")) response = client.models.generate_content( model="gemini-2.0-flash-001", contents=[ "What is shown in this image?", Part.from_uri( file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg", mime_type="image/jpeg", ), ], ) print(response.text)

Klicken Sie auf Datei > Speichern, geben Sie genai.py in das Feld „Name“ ein und klicken Sie auf Speichern.
Führen Sie folgenden Befehl aus, um die Umgebungsvariablen im neuen Terminal festzulegen:
export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}' export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}' export GOOGLE_GENAI_USE_VERTEXAI=True
Führen Sie die Python-Datei mit folgendem Befehl im Terminalbereich des Code-Editors aus, um die Ausgabe zu sehen.

/usr/bin/python3 /genai.py

Hinweis: Wenn ein 400-Fehler auftritt, versuchen Sie, den Code noch einmal auszuführen.

Erläuterung zum Code:

Mit dem Code-Snippet wird ein vortrainiertes KI-Modell namens Gemini (gemini-2.0-flash-001) in Vertex AI geladen.
Der Code ruft die Methode generate_content des geladenen Gemini-Modells auf.
Die Eingabe für die Methode ist ein Bild-URI und ein Prompt mit einer Frage zum Bild.
Der Code nutzt die Fähigkeit von Gemini, Bilder und Text gemeinsam zu verstehen. Der Text, der im Prompt angegeben wurde, wird verwendet, um den Inhalt des Bildes zu beschreiben.

Sie möchten es selbst ausprobieren? Experimentieren Sie mit verschiedenen Bild-URIs und Prompt-Fragen, um die Möglichkeiten von Gemini zu erkunden.

Klicken Sie auf Fortschritt prüfen.

Inhalte für das Bild generieren

Glückwunsch!

Sie haben das Lab erfolgreich abgeschlossen. Glückwunsch!

© 2025 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.

Mit Gemini in Vertex AI eine Anwendung zur KI-Bilderkennung erstellen

Übersicht

Ziel

Mit dem Vertex AI Python SDK arbeiten

Erläuterung zum Code:

Glückwunsch!

Vorbereitung

Privates Surfen verwenden

In der Konsole anmelden

Privates Surfen für das Lab verwenden