Send a text prompt to Gen AI and receive a image response
Dieses Lab kann KI-Tools enthalten, die den Lernprozess unterstützen.
bb-ide-genai-002
Übersicht
- Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer beginnt zu laufen, wenn Sie auf Lab starten klicken.
- Das enthaltene Cloud-Terminal ist mit dem gcloud SDK vorkonfiguriert.
- Führen Sie Befehle über das Terminal aus und klicken Sie dann auf Fortschritt prüfen, um Ihre Arbeit zu überprüfen.
Ziel
Generative KI (auch als GenAI bezeichnet) in Agent Platform ermöglicht Ihnen
Zugriff auf die großen generativen KI-Modelle von Google. So können Sie diese
testen, abstimmen und in Ihren KI-basierten Anwendungen nutzen. Aufgaben in
diesem Lab:
-
Verbindung zu Agent Platform (KI-Plattform von Google Cloud)
herstellen:
Sie lernen, wie Sie mit dem Agent Platform SDK eine Verbindung zu den
KI-Diensten von Google herstellen.
-
Vortrainiertes Modell zur Bildgenerierung laden : Sie
erfahren, wie Sie ein leistungsstarkes, vortrainiertes KI-Modell verwenden
können, ohne es von Grund auf neu zu erstellen.
-
Text an das KI-Modell senden: Sie lernen, Eingaben
bereitzustellen, die von der KI verarbeitet werden können.
-
Bildbasierte Antworten aus der KI extrahieren: Sie
erfahren, wie Sie die vom KI-Modell generierten Bildantworten verarbeiten
und interpretieren.
-
Grundlagen für das Erstellen von KI-Anwendungen: Sie
erhalten Einblicke in die wichtigsten Konzepte für die Integration von KI in
Softwareprojekte.
Arbeiten mit generativer KI
Wenn Sie das Lab starten, wird Ihnen eine Ansicht mit zwei Bereichen
angezeigt: links sehen Sie den Code-Editor und rechts die Lab-Anleitung.
Führen Sie folgenden Schritte aus, um mithilfe des Agent Platform Python SDK
mit den APIs für generative KI zu interagieren.
-
Klicken Sie auf Datei > Neue Datei, um eine neue Datei im
Code-Editor zu öffnen.
-
Kopieren Sie das bereitgestellte Code-Snippet und fügen Sie es in Ihre Datei
ein.
import argparse import vertexai from vertexai.preview.vision_models import
ImageGenerationModel def generate_image( project_id: str, location: str,
output_file: str, prompt: str ) ->
vertexai.preview.vision_models.ImageGenerationResponse: """Generate an image
using a text prompt. Args: project_id: Google Cloud project ID, used to
initialize Agent Platform. location: Google Cloud region, used to initialize
Agent Platform. output_file: Local path to the output image file. prompt: The
text prompt describing what you want to see."""
vertexai.init(project=project_id, location=location) model =
ImageGenerationModel.from_pretrained("imagen-3.0-generate-002") images =
model.generate_images( prompt=prompt, # Optional parameters
number_of_images=1, seed=1, add_watermark=False, )
images[0].save(location=output_file) return images generate_image(
project_id='{{{ project_0.project_id | "project-id" }}}', location='{{{
project_0.default_region | "REGION" }}}', output_file='image.jpeg',
prompt='Create an image of a cricket ground in the heart of Los Angeles', )
-
Klicken Sie auf Datei > Speichern, geben Sie
GenerateImage.py in das Feld „Name“ ein und klicken Sie auf
Speichern.
-
Führen Sie die Python-Datei aus, indem Sie auf das Dreieckssymbol im
Code-Editor klicken oder den folgenden Befehl im Terminalbereich des
Code-Editors aufrufen. Dadurch wird eine Bilddatei mit dem Namen
image.jpeg erstellt.
/usr/bin/python3 /GenerateImage.py
-
Klicken Sie auf EXPLORER > image.jpeg, um das generierte
Bild anzusehen.
Erläuterung zum Code:
-
Mit dem Code-Snippet wird ein vortrainiertes KI-Modell namens
ImageGenerationModel (imagen-3.0-generate-002) in Agent
Platform geladen.
-
Der Code ruft die Methode
generate_image des geladenen
Gemini-Modells auf.
- Die Eingabe für die Methode ist ein Text-Prompt.
-
Der Code nutzt die Fähigkeit von Gemini, den Text-Prompt zu verstehen und
damit ein KI-Bild zu erstellen.
Hinweis: Standardmäßig wird Bildern ein
SynthID-Wasserzeichen hinzugefügt. Sie können dies jedoch deaktivieren, indem
Sie den optionalen Parameter add_watermark=False angeben. Sie
können nicht gleichzeitig einen Startwert und ein Wasserzeichen verwenden.
Weitere Informationen zum SynthID-Wasserzeichen
Sie möchten es selbst ausprobieren? Experimentieren Sie mit
verschiedenen Prompts, um die Möglichkeiten von Gemini zu erkunden.
Klicken Sie auf Fortschritt prüfen.
Anfragen für Text-Prompts an generative KI senden und eine Antwort erhalten
Das wars!
Sie haben das Lab erfolgreich abgeschlossen. Glückwunsch!
© 2026 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.