Mit Imagen in Agent Platform eine Anwendung zur KI-Bildgenerierung erstellen

Send a text prompt to Gen AI and receive a image response

Fortschritt prüfen

/ 100

Dieses Lab kann KI-Tools enthalten, die den Lernprozess unterstützen.

bb-ide-genai-002

Google Cloud-Labs zum selbstbestimmten Lernen

Übersicht

Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer beginnt zu laufen, wenn Sie auf Lab starten klicken.
Das enthaltene Cloud-Terminal ist mit dem gcloud SDK vorkonfiguriert.
Führen Sie Befehle über das Terminal aus und klicken Sie dann auf Fortschritt prüfen, um Ihre Arbeit zu überprüfen.

Ziel

Generative KI (auch als GenAI bezeichnet) in Agent Platform ermöglicht Ihnen Zugriff auf die großen generativen KI-Modelle von Google. So können Sie diese testen, abstimmen und in Ihren KI-basierten Anwendungen nutzen. Aufgaben in diesem Lab:

Verbindung zu Agent Platform (KI-Plattform von Google Cloud) herstellen: Sie lernen, wie Sie mit dem Agent Platform SDK eine Verbindung zu den KI-Diensten von Google herstellen.
Vortrainiertes Modell zur Bildgenerierung laden : Sie erfahren, wie Sie ein leistungsstarkes, vortrainiertes KI-Modell verwenden können, ohne es von Grund auf neu zu erstellen.
Text an das KI-Modell senden: Sie lernen, Eingaben bereitzustellen, die von der KI verarbeitet werden können.
Bildbasierte Antworten aus der KI extrahieren: Sie erfahren, wie Sie die vom KI-Modell generierten Bildantworten verarbeiten und interpretieren.
Grundlagen für das Erstellen von KI-Anwendungen: Sie erhalten Einblicke in die wichtigsten Konzepte für die Integration von KI in Softwareprojekte.

Arbeiten mit generativer KI

Wenn Sie das Lab starten, wird Ihnen eine Ansicht mit zwei Bereichen angezeigt: links sehen Sie den Code-Editor und rechts die Lab-Anleitung. Führen Sie folgenden Schritte aus, um mithilfe des Agent Platform Python SDK mit den APIs für generative KI zu interagieren.

Klicken Sie auf Datei > Neue Datei, um eine neue Datei im Code-Editor zu öffnen.
Kopieren Sie das bereitgestellte Code-Snippet und fügen Sie es in Ihre Datei ein.

import argparse import vertexai from vertexai.preview.vision_models import ImageGenerationModel def generate_image( project_id: str, location: str, output_file: str, prompt: str ) -> vertexai.preview.vision_models.ImageGenerationResponse: """Generate an image using a text prompt. Args: project_id: Google Cloud project ID, used to initialize Agent Platform. location: Google Cloud region, used to initialize Agent Platform. output_file: Local path to the output image file. prompt: The text prompt describing what you want to see.""" vertexai.init(project=project_id, location=location) model = ImageGenerationModel.from_pretrained("imagen-3.0-generate-002") images = model.generate_images( prompt=prompt, # Optional parameters number_of_images=1, seed=1, add_watermark=False, ) images[0].save(location=output_file) return images generate_image( project_id='{{{ project_0.project_id | "project-id" }}}', location='{{{ project_0.default_region | "REGION" }}}', output_file='image.jpeg', prompt='Create an image of a cricket ground in the heart of Los Angeles', )

Klicken Sie auf Datei > Speichern, geben Sie GenerateImage.py in das Feld „Name“ ein und klicken Sie auf Speichern.
Führen Sie die Python-Datei aus, indem Sie auf das Dreieckssymbol im Code-Editor klicken oder den folgenden Befehl im Terminalbereich des Code-Editors aufrufen. Dadurch wird eine Bilddatei mit dem Namen image.jpeg erstellt.

/usr/bin/python3 /GenerateImage.py

Klicken Sie auf EXPLORER > image.jpeg, um das generierte Bild anzusehen.

Erläuterung zum Code:

Mit dem Code-Snippet wird ein vortrainiertes KI-Modell namens ImageGenerationModel (imagen-3.0-generate-002) in Agent Platform geladen.
Der Code ruft die Methode generate_image des geladenen Gemini-Modells auf.
Die Eingabe für die Methode ist ein Text-Prompt.
Der Code nutzt die Fähigkeit von Gemini, den Text-Prompt zu verstehen und damit ein KI-Bild zu erstellen.

Hinweis: Standardmäßig wird Bildern ein SynthID-Wasserzeichen hinzugefügt. Sie können dies jedoch deaktivieren, indem Sie den optionalen Parameter add_watermark=False angeben. Sie können nicht gleichzeitig einen Startwert und ein Wasserzeichen verwenden. Weitere Informationen zum SynthID-Wasserzeichen

Sie möchten es selbst ausprobieren? Experimentieren Sie mit verschiedenen Prompts, um die Möglichkeiten von Gemini zu erkunden.

Klicken Sie auf Fortschritt prüfen.

Anfragen für Text-Prompts an generative KI senden und eine Antwort erhalten

Das wars!

Sie haben das Lab erfolgreich abgeschlossen. Glückwunsch!

© 2026 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.

bb-ide-genai-002

Übersicht

Ziel

Arbeiten mit generativer KI

Erläuterung zum Code:

Das wars!

Vorbereitung

Privates Surfen verwenden

In der Konsole anmelden

Privates Surfen für das Lab verwenden