Mit Gemini in Vertex AI eine Anwendung zur KI-Bilderkennung erstellen
Lab
15 Minuten
universal_currency_alt
Keine Kosten
show_chart
Einsteiger
info
Dieses Lab kann KI-Tools enthalten, die den Lernprozess unterstützen.
Zugriff auf über 700 Labs und Kurse nutzen

Übersicht
- Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer beginnt zu laufen, wenn Sie auf Lab starten klicken.
- Das enthaltene Cloud-Terminal ist mit dem gcloud SDK vorkonfiguriert.
- Führen Sie Befehle über das Terminal aus und klicken Sie dann auf Fortschritt prüfen, um Ihre Arbeit zu überprüfen.
Ziel
Generative KI (auch als GenAI bezeichnet) in Vertex AI ermöglicht Ihnen Zugriff auf die großen generativen KI-Modelle von Google. So können Sie diese testen, abstimmen und in Ihren KI-basierten Anwendungen nutzen Aufgaben in diesem Lab:
-
Verbindung zu Vertex AI (KI-Plattform von Google Cloud) herstellen: Sie lernen, wie Sie mit dem Vertex AI SDK eine Verbindung zu den KI-Diensten von Google herstellen.
-
Vortrainiertes generatives KI-Modell laden – Gemini: Sie erfahren, wie Sie ein leistungsstarkes, vortrainiertes KI-Modell verwenden können, ohne es von Grund auf neu zu erstellen.
-
Bild- und Textfragen an das KI-Modell senden: Sie lernen, Eingaben bereitzustellen, die von der KI verarbeitet werden können.
-
Textbasierte Antworten aus der KI extrahieren: Sie erfahren, wie Sie die vom KI-Modell generierten Textantworten verarbeiten und interpretieren.
-
Grundlagen für das Erstellen von KI-Anwendungen: Sie erhalten Einblicke in die wichtigsten Konzepte für die Integration von KI in Softwareprojekte.
Mit dem Vertex AI Python SDK arbeiten
Wenn Sie das Lab starten, wird Ihnen eine Ansicht mit zwei Bereichen angezeigt: links sehen Sie den Code-Editor und rechts die Lab-Anleitung. Führen Sie folgende Schritte aus, um mithilfe des Vertex AI Python SDK mit den APIs für generative KI zu interagieren.
- Klicken Sie auf Datei > Neue Datei, um eine neue Datei im Code-Editor zu öffnen.
- Kopieren Sie das bereitgestellte Code-Snippet und fügen Sie es in die Datei ein.
from google import genai
from google.genai.types import HttpOptions, Part
client = genai.Client(http_options=HttpOptions(api_version="v1"))
response = client.models.generate_content(
model="gemini-2.0-flash-001",
contents=[
"What is shown in this image?",
Part.from_uri(
file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg",
mime_type="image/jpeg",
),
],
)
print(response.text)
-
Klicken Sie auf Datei > Speichern, geben Sie genai.py in das Feld „Name“ ein und klicken Sie auf Speichern.
-
Führen Sie folgenden Befehl aus, um die Umgebungsvariablen im neuen Terminal festzulegen:
export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}'
export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}'
export GOOGLE_GENAI_USE_VERTEXAI=True
-
Führen Sie die Python-Datei mit folgendem Befehl im Terminalbereich des Code-Editors aus, um die Ausgabe zu sehen.
/usr/bin/python3 /genai.py
Hinweis: Wenn ein 400-Fehler auftritt, versuchen Sie, den Code noch einmal auszuführen.
Erläuterung zum Code:
- Mit dem Code-Snippet wird ein vortrainiertes KI-Modell namens Gemini (gemini-2.0-flash-001) in Vertex AI geladen.
- Der Code ruft die Methode
generate_content des geladenen Gemini-Modells auf.
- Die Eingabe für die Methode ist ein Bild-URI und ein Prompt mit einer Frage zum Bild.
- Der Code nutzt die Fähigkeit von Gemini, Bilder und Text gemeinsam zu verstehen. Der Text, der im Prompt angegeben wurde, wird verwendet, um den Inhalt des Bildes zu beschreiben.
Sie möchten es selbst ausprobieren? Experimentieren Sie mit verschiedenen Bild-URIs und Prompt-Fragen, um die Möglichkeiten von Gemini zu erkunden.
Klicken Sie auf Fortschritt prüfen.
Inhalte für das Bild generieren
Glückwunsch!
Sie haben das Lab erfolgreich abgeschlossen. Glückwunsch!
© 2025 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.