GSP1336
Übersicht
In diesem Lab lernen Sie die leistungsstarken multimodalen Funktionen von Google AI Studio kennen, wobei der Schwerpunkt auf generativer KI und räumlicher Analyse liegt. Durch anwendungsorientierte Übungen sammeln Sie praktische Erfahrungen mit modernsten KI-Modellen und lernen, wie Sie diese in Ihre Anwendungen einbinden. Als Museumskurator und Ausstellungsdesigner verwenden Sie diese Tools, um Ideen für eine neue Museumsausstellung zu sammeln und Prototypen zu erstellen.
Lerninhalte
Aufgaben in diesem Lab:
- Prompts für Modelle erstellen, um Bilder und Videoclips zu generieren
- Ein Modell auffordern, ein Video im Langformat zu analysieren
- Eine App für räumliches Verständnis aus einer Vorlage erstellen
- Prototyp der App für räumliches Verständnis auffordern, Elemente in einem Bild zu identifizieren
Einrichtung und Anforderungen
Vor dem Klick auf „Start Lab“ (Lab starten)
Lesen Sie diese Anleitung. Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer beginnt zu laufen, wenn Sie auf Lab starten klicken, und zeigt Ihnen, wie lange Google Cloud-Ressourcen für das Lab verfügbar sind.
In diesem praxisorientierten Lab können Sie die Lab-Aktivitäten in einer echten Cloud-Umgebung durchführen – nicht in einer Simulations- oder Demo-Umgebung. Dazu erhalten Sie neue, temporäre Anmeldedaten, mit denen Sie für die Dauer des Labs auf Google Cloud zugreifen können.
Für dieses Lab benötigen Sie Folgendes:
- Einen Standardbrowser (empfohlen wird Chrome)
Hinweis: Nutzen Sie den privaten oder Inkognitomodus (empfohlen), um dieses Lab durchzuführen. So wird verhindert, dass es zu Konflikten zwischen Ihrem persönlichen Konto und dem Teilnehmerkonto kommt und zusätzliche Gebühren für Ihr persönliches Konto erhoben werden.
- Zeit für die Durchführung des Labs – denken Sie daran, dass Sie ein begonnenes Lab nicht unterbrechen können.
Hinweis: Verwenden Sie für dieses Lab nur das Teilnehmerkonto. Wenn Sie ein anderes Google Cloud-Konto verwenden, fallen dafür möglicherweise Kosten an.
Google AI Studio öffnen
-
Klicken Sie auf Lab starten. Im Lab-Bereich werden die temporären Anmeldedaten für dieses Lab angezeigt.
-
Hinweis: Wenn es sich um ein kostenpflichtiges Lab handelt, werden Sie aufgefordert, eine Zahlungsmethode auszuwählen.
-
Öffnen Sie Google AI Studio in einem Inkognitofenster. Die Google Log-in-Seite wird angezeigt.
-
Tipp: Ordnen Sie die Tabs für das Lab und AI Studio nebeneinander in separaten Fenstern an, um leichter darauf zugreifen zu können.
-
Kopieren Sie den nachfolgenden Nutzernamen und fügen Sie ihn in das Feld E-Mail ein. Klicken Sie dann auf Weiter.
{{{user_0.username | "Username"}}}
-
Kopieren Sie das nachfolgende Passwort und fügen Sie es in das Feld Passwort eingeben ein. Klicken Sie dann auf Weiter.
{{{user_0.password | "Password"}}}
-
Akzeptieren Sie die Nutzungsbedingungen auf dem Bildschirm, um fortzufahren.
Sie sind jetzt mit Ihrem temporären Teilnehmerkonto in Google AI Studio angemeldet.
Aufgabe 1: Bilder und Videoclips erstellen
In dieser Aufgabe schlüpfen Sie in die Rolle des Kurators und erstellen ein Konzeptbild und ein kurzes Werbevideo für eine neue Dinosaurierausstellung. Dazu werden Modelle verwendet, die speziell für die Mediengenerierung entwickelt wurden.
Konzeptbild mit der Bildgenerierung von Gemini erstellen
-
Klicken Sie im linken Navigationsmenü auf Chat.
-
Wählen Sie Bilder und dann Imagen aus den aufgeführten Optionen aus.
-
Geben Sie im Prompt-Eingabefeld eine Anfrage für Ihr Konzeptbild ein:
Ein fotorealistisches Bild des futuristischen Foyers eines Naturkundemuseums mit einem riesigen T-Rex-Skelett aus leuchtend blauen Kristallen.
-
Klicken Sie auf Ausführen, und sehen Sie sich das generierte Bild an. Dieses Bild könnte als Grundlage für das Design Ihrer neuen Ausstellung dienen.
-
Sie können Ihre Prompts und Antworten speichern, indem Sie auf das Symbol zum Speichern von Prompts
klicken und dann Titel und Beschreibung des Prompts bearbeiten.
-
Ein neues Pop-up-Fenster erscheint. Wählen Sie Ihr Teilnehmerkonto aus (z. B. student-XX-YYYY@qwiklabs.net), und erteilen Sie alle erforderlichen Berechtigungen, um fortzufahren.
- Geben Sie als Prompt-Name Futuristisches Museumsfoyer ein.
-
Klicken Sie auf Speichern.
Werbevideoclip mit Veo erstellen
-
Klicken Sie im linken Navigationsmenü auf Chat.
-
Wählen Sie Video und dann Veo aus den aufgeführten Optionen aus, um ein Video zu generieren.
-
Suchen Sie im rechten Bereich nach der Einstellung Videolänge, und ändern Sie diese auf 8 Sekunden. Legen Sie als Seitenverhältnis 9:16 fest.
-
Beschreiben Sie im Eingabefeld für den Prompt einen kurzen, dynamischen Clip für soziale Medien:
Ein kinematografisches Zeitlupenvideo eines detaillierten, animatronischen Triceratops, der seinen Kopf dreht und mit einem Auge zwinkert.
- Klicken Sie auf Ausführen.
Hinweis: Wenn das Dialogfeld Drive-Zugriff zulassen angezeigt wird, klicken Sie auf die Schaltfläche Zugriff zulassen. Ein neues Pop-up-Fenster erscheint. Wählen Sie Ihr Teilnehmerkonto aus (z. B. student-XX-YYYY@qwiklabs.net), und erteilen Sie alle erforderlichen Berechtigungen, um fortzufahren.
- Das Modell beginnt mit der Generierung des Videos. Klicken Sie auf Video abspielen, sobald diese Option angezeigt wird, um sich den Clip anzusehen.
Klicken Sie auf Fortschritt prüfen.
Bilder und Videoclips erstellen
Aufgabe 2: Ein Modell auffordern, ein Video im Langformat zu analysieren
In dieser Aufgabe recherchieren Sie erfolgreiche Ausstellungen, indem Sie Gemini bitten, eine Videotour durch das American Museum of Natural History zu analysieren.
-
Klicken Sie im Navigationsmenü links auf Chat, um zur Hauptoberfläche für den Chat zurückzukehren.
-
Öffnen Sie im rechten Bereich die Seitenleiste Ausführungseinstellungen, und klicken Sie auf das Standardmodell von Gemini (derzeit Nano Banana), um ein anderes Modell auszuwählen.
-
Klicken Sie unter Modellauswahl auf den Tab Gemini, und wählen Sie das Modell aus, da es für die Verarbeitung großer Eingaben wie Videos konzipiert ist.
-
Klicken Sie in der Promptleiste auf das Anhangssymbol (ein Pluszeichen in einem Kreis), und wählen Sie Beispielmedien aus.
-
Wählen Sie in der Liste der Videos American Museum of Natural History Tour – 10 Min aus, und klicken Sie auf Zum Prompt hinzufügen.
-
Warten Sie, bis die Videoverarbeitung abgeschlossen ist. Das Video wird im Prompt-Bereich angezeigt, und die Anzahl der Tokens wird eingeblendet.
Hinweis: Nach dem Hinzufügen des Videos wird eine hohe Anzahl von Tokens angezeigt. Ein Sprachmodell „sieht“ ein Video als eine Folge von Tausenden von einzelnen Frames. Jeder Frame wird in numerische Daten umgewandelt, die als Tokens bezeichnet werden, und die das Modell analysiert. Die angezeigte Verarbeitungszeit ist die Zeit, die das Modell benötigt, um alle diese Tokens zu „lesen“, bevor es Ihre Frage zum Video beantworten kann.
- Geben Sie in das Textfeld über dem Video den folgenden Prompt ein:
Fassen Sie die wichtigsten Exponate zusammen, die in dieser Videotour gezeigt werden. Listen Sie jede einzelne Halle oder Rubrik auf, und beschreiben Sie sie jeweils in einem Satz.
-
Klicken Sie auf Ausführen, und sehen Sie sich die Textzusammenfassung des Videoinhalts an, die vom Modell erstellt wurde.
-
Geben Sie als Prompt-Name Highlights Museumsexponate ein.
-
Klicken Sie auf Speichern.
Klicken Sie auf Fortschritt prüfen.
Modell auffordern, ein Video im Langformat zu analysieren
Aufgabe 3: Eine App für räumliches Verständnis aus einer Vorlage erstellen
In dieser Aufgabe erstellen Sie schnell einen Prototyp für eine interaktive „Fragen Sie das Exponat“-Funktion für Museumsbesucher, indem Sie eine App aus einer Vorlage erstellen, ohne Code zu schreiben.
-
Klicken Sie im linken Navigationsmenü auf Erstellen.
-
Scrollen Sie durch die Galerie der App-Vorlagen, um die Kachel Räumliches Verständnis zu finden.
-
Klicken Sie auf die Vorlage Räumliches Verständnis, um den App-Prototyp sofort zu generieren.

- Die Benutzeroberfläche wird mit dem Code der Anwendung in der Mitte und einer Live-Vorschau der App auf der rechten Seite geladen.
Klicken Sie auf Fortschritt prüfen.
Eine App für räumliches Verständnis aus einer Vorlage erstellen
Aufgabe 4: Prototyp der App für räumliches Verständnis prompten
In dieser Aufgabe testen Sie den Prototyp, den Sie gerade erstellt haben. Sie simulieren eine Besucherinteraktion, indem Sie die App bitten, Objekte in einem Beispielbild von einer Erntedankfestausstellung zu identifizieren, und den Code ändern, um die Farbe des Begrenzungsrahmens zu ändern.
Funktionen der App kennenlernen
-
Suchen Sie rechts im Bereich Vorschau der App unten nach den Beispielbildern. Klicken Sie auf das Bild, auf dem mehrere Kürbisse zu sehen sind.
-
Achten Sie darauf, dass über dem Promptfeld die Schaltfläche 2D-Begrenzungsrahmen ausgewählt ist. Geben Sie im Eingabefeld PROMPT Kürbis ein, und klicken Sie auf Senden. Sehen Sie sich die Standardbegrenzungsrahmen an, die um die Kürbisse gezeichnet wurden.
Hinweis: Ein Begrenzungsrahmen ist ein Rechteck, das die genaue Position eines Objekts in einem Bild hervorhebt. Damit demonstriert ein Modell für Computer Vision sein räumliches Verständnis – es zeigt Ihnen nicht nur, was es sieht, sondern auch, wo es etwas sieht.
-
Wählen Sie nun die Schaltfläche Segmentierungsmasken aus, und klicken Sie noch einmal auf Senden. Beachten Sie, wie sich die Ausgabe ändert und die Farbe im gesamten Bereich jedes erkannten Kürbisses angezeigt wird.
-
Wählen Sie dann die Schaltfläche Punkte aus, und klicken Sie auf Senden. Sehen Sie sich an, wie das Modell Schlüsselpunkte auf den erkannten Objekten platziert.
App mit dem Codeassistenten ändern
-
Achten Sie darauf, dass im Vorschaubereich die Schaltfläche 2D-Begrenzungsrahmen ausgewählt ist, bevor Sie fortfahren.
-
Richten Sie Ihre Aufmerksamkeit nun auf das Eingabefeld Codeassistent unten links auf dem Bildschirm, in dem „Änderungen vornehmen, neue Funktionen hinzufügen…“ steht. Geben Sie den folgenden Befehl ein:
Begrenzungsrahmen rot darstellen
-
Drücken Sie die Eingabetaste, oder klicken Sie auf den Senden-Button für den Assistenten. Beobachten Sie, wie der Assistent den Anwendungscode im zentralen Editorfenster ändert.
-
Sobald der Code aktualisiert wurde, kehren Sie zum Bereich Vorschau auf der rechten Seite zurück. Während das Kürbisbild und der 2D-Begrenzungsrahmen noch ausgewählt sind, klicken Sie ein letztes Mal auf die Schaltfläche Senden für den Prompt Kürbis.
-
Sehen Sie sich das Ergebnis an. Die um die Kürbisse gezeichneten Begrenzungsrahmen sollten jetzt rot sein. Das zeigt, dass Sie eine Liveanwendung mit einem einfachen Textbefehl erfolgreich geändert haben.
-
Optionale Aufgabe: Sie haben gesehen, wie einfach es ist, die App mit Text zu ändern. Bevor Sie fortfahren, können Sie dem Codeassistenten noch weitere Befehle geben. Sie können herausfinden, wie Sie Folgendes tun:
- Die Farbe des Begrenzungsrahmens in
Grün ändern
- Die Linie des Begrenzungsrahmens
gepunktet statt durchgezogen darstellen
- Die Linie des Begrenzungsrahmens in eine dicke, gestrichelte Linie ändern
- Die Farbe des Labeltexts in Weiß ändern
-
Klicken Sie zum Speichern der App auf das Speichern-Symbol
, um den Titel und die Beschreibung des Prompts zu bearbeiten.
- Geben Sie unter Prompt-Name Räumliches Verständnis ein.
-
Klicken Sie auf Speichern.
Klicken Sie auf Fortschritt prüfen.
Prototyp der App für räumliches Verständnis prompten
Glückwunsch!
Glückwunsch! Sie haben die multimodalen Funktionen von Google AI Studio erfolgreich genutzt, um Ideen für eine neue Museumsausstellung zu sammeln und einen Prototyp zu erstellen. Sie haben Konzeptbilder und Videoclips erstellt, eine bestehende Videotour analysiert und sogar einen interaktiven Prototyp mit einer App für räumliches Verständnis entwickelt. Sie haben jetzt praktische Erfahrung mit KI, die eine Vielzahl von Rich Media sehen, verstehen und generieren kann.
Google Cloud-Schulungen und -Zertifizierungen
In unseren Schulungen erfahren Sie alles zum optimalen Einsatz unserer Google Cloud-Technologien und können sich entsprechend zertifizieren lassen. Unsere Kurse vermitteln technische Fähigkeiten und Best Practices, damit Sie möglichst schnell mit Google Cloud loslegen und Ihr Wissen fortlaufend erweitern können. Wir bieten On-Demand-, Präsenz- und virtuelle Schulungen für Anfänger wie Fortgeschrittene an, die Sie individuell in Ihrem eigenen Zeitplan absolvieren können. Mit unseren Zertifizierungen weisen Sie nach, dass Sie Experte im Bereich Google Cloud-Technologien sind.
Anleitung zuletzt am 16. Oktober 2025 aktualisiert
Lab zuletzt am 16. Oktober 2025 getestet
© 2026 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.