Anleitung und Anforderungen für Lab-Einrichtung
Schützen Sie Ihr Konto und Ihren Fortschritt. Verwenden Sie immer den privaten Modus und Lab-Anmeldedaten, um dieses Lab auszuführen.

Multimodale Vektorsuche in BigQuery kennenlernen

Lab 30 Minuten universal_currency_alt 1 Guthabenpunkt show_chart Einsteiger
info Dieses Lab kann KI-Tools enthalten, die den Lernprozess unterstützen.
Dieser Inhalt ist noch nicht für Mobilgeräte optimiert.
Die Lernumgebung funktioniert am besten, wenn Sie auf einem Computer über einen per E‑Mail gesendeten Link darauf zugreifen.

GSP1334

Logo: Google Cloud-Labs zum selbstbestimmten Lernen

Übersicht

Angenommen, Sie möchten einen Katalog mit Produktbildern durchsuchen, die in Cloud Storage gespeichert sind, um herauszufinden, ob bereits in der Vergangenheit ein ähnliches Produkt verkauft wurde. Das ist mit der Vektorsuche in BigQuery möglich.

BigQuery ist eine vollständig verwaltete, KI‑fähige Datenplattform, die die nahtlose Einbindung externer Datenquellen (wie Metadaten aus Bildern in einem Cloud Storage-Bucket) und Verbindungen zu Remote-Modellen für die Vektorsuche unterstützt, um Datenanalyse-Workflows mit generativer KI zu optimieren.

Die Vektorsuche ist eine Methode, mit der ähnliche Elemente anhand ihrer semantischen Bedeutung (anstatt der genauen Übereinstimmung mit Suchbegriffen) schnell gefunden werden können. Sie kann auf viele Arten von Daten angewendet werden, darunter Bilder, Videos und Text. Bei der Vektorsuche kommen Einbettungen zum Einsatz. Das sind hochdimensionale numerische Vektoren, die eine Entität wie Text oder ein Bild darstellen. Die Einbettungen enthalten semantische Informationen zu diesen Entitäten, um den Vergleich zu erleichtern. Das lässt sich in vielen Bereichen anwenden, zum Beispiel um historische Verkaufszahlen ähnlicher Artikel in einem Inventardatensatz oder Produktbildkatalog besser suchen zu können.

Anhand eines Produktnamens oder einer Produktbeschreibung können Sie per Vektorsuche eine BigQuery-Objekttabelle mit Metadaten zu den Produktbildern durchsuchen und die Produkte finden, die Ihren Suchbegriffen am ähnlichsten sind. In diesem Workflow wird für die Vektorsuche Vertex AI in BigQuery eingebunden. So können Sie multimodale Daten (einschließlich Bildern und Text) in BigQuery analysieren, um umsetzbare Informationen zu extrahieren und die Entscheidungsfindung zu verbessern.

In diesem Lab erhalten Sie eine kurze Einführung in die multimodale Vektorsuche in BigQuery. Zuerst erteilen Sie einige Berechtigungen und stellen eine Verbindung zu einem Einbettungsmodell in BigQuery her. Anschließend rufen Sie das Modell auf, um eine Einbettungstabelle zu generieren, in der Vektordarstellungen von Produktbildern in einem Cloud Storage-Bucket gespeichert werden. Zuletzt führen Sie eine Vektorsuche nach Produktbildern aus, die in Cloud Storage gespeichert sind, um anhand von Bildmerkmalen und ‑metadaten die Produkte zu finden, die Ihren Suchbegriffen am ähnlichsten sind.

Aufgaben

Aufgaben in diesem Lab:

  • Dem BigQuery-Dienstkonto IAM-Rollen (Identity and Access Management) zuweisen
  • Verbindung zu einem Remote-Einbettungsmodell in BigQuery herstellen
  • Einbettungen generieren und in einer Tabelle in BigQuery speichern
  • Vektorsuche nach den Produktbildern in Cloud Storage ausführen

Einrichtung und Anforderungen

Vor dem Klick auf „Start Lab“ (Lab starten)

Lesen Sie diese Anleitung. Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer beginnt zu laufen, wenn Sie auf Lab starten klicken, und zeigt Ihnen, wie lange Google Cloud-Ressourcen für das Lab verfügbar sind.

In diesem praxisorientierten Lab können Sie die Lab-Aktivitäten in einer echten Cloud-Umgebung durchführen – nicht in einer Simulations- oder Demo-Umgebung. Dazu erhalten Sie neue, temporäre Anmeldedaten, mit denen Sie für die Dauer des Labs auf Google Cloud zugreifen können.

Für dieses Lab benötigen Sie Folgendes:

  • Einen Standardbrowser (empfohlen wird Chrome)
Hinweis: Nutzen Sie den privaten oder Inkognitomodus (empfohlen), um dieses Lab durchzuführen. So wird verhindert, dass es zu Konflikten zwischen Ihrem persönlichen Konto und dem Teilnehmerkonto kommt und zusätzliche Gebühren für Ihr persönliches Konto erhoben werden.
  • Zeit für die Durchführung des Labs – denken Sie daran, dass Sie ein begonnenes Lab nicht unterbrechen können.
Hinweis: Verwenden Sie für dieses Lab nur das Teilnehmerkonto. Wenn Sie ein anderes Google Cloud-Konto verwenden, fallen dafür möglicherweise Kosten an.

Lab starten und bei der Google Cloud Console anmelden

  1. Klicken Sie auf Lab starten. Wenn Sie für das Lab bezahlen müssen, wird ein Dialogfeld geöffnet, in dem Sie Ihre Zahlungsmethode auswählen können. Auf der linken Seite befindet sich der Bereich „Details zum Lab“ mit diesen Informationen:

    • Schaltfläche „Google Cloud Console öffnen“
    • Restzeit
    • Temporäre Anmeldedaten für das Lab
    • Ggf. weitere Informationen für dieses Lab
  2. Klicken Sie auf Google Cloud Console öffnen (oder klicken Sie mit der rechten Maustaste und wählen Sie Link in Inkognitofenster öffnen aus, wenn Sie Chrome verwenden).

    Im Lab werden Ressourcen aktiviert. Anschließend wird ein weiterer Tab mit der Seite „Anmelden“ geöffnet.

    Tipp: Ordnen Sie die Tabs nebeneinander in separaten Fenstern an.

    Hinweis: Wird das Dialogfeld Konto auswählen angezeigt, klicken Sie auf Anderes Konto verwenden.
  3. Kopieren Sie bei Bedarf den folgenden Nutzernamen und fügen Sie ihn in das Dialogfeld Anmelden ein.

    {{{user_0.username | "Username"}}}

    Sie finden den Nutzernamen auch im Bereich „Details zum Lab“.

  4. Klicken Sie auf Weiter.

  5. Kopieren Sie das folgende Passwort und fügen Sie es in das Dialogfeld Willkommen ein.

    {{{user_0.password | "Password"}}}

    Sie finden das Passwort auch im Bereich „Details zum Lab“.

  6. Klicken Sie auf Weiter.

    Wichtig: Sie müssen die für das Lab bereitgestellten Anmeldedaten verwenden. Nutzen Sie nicht die Anmeldedaten Ihres Google Cloud-Kontos. Hinweis: Wenn Sie Ihr eigenes Google Cloud-Konto für dieses Lab nutzen, können zusätzliche Kosten anfallen.
  7. Klicken Sie sich durch die nachfolgenden Seiten:

    • Akzeptieren Sie die Nutzungsbedingungen.
    • Fügen Sie keine Wiederherstellungsoptionen oder Zwei-Faktor-Authentifizierung hinzu (da dies nur ein temporäres Konto ist).
    • Melden Sie sich nicht für kostenlose Testversionen an.

Nach wenigen Augenblicken wird die Google Cloud Console in diesem Tab geöffnet.

Hinweis: Wenn Sie auf Google Cloud-Produkte und ‑Dienste zugreifen möchten, klicken Sie auf das Navigationsmenü oder geben Sie den Namen des Produkts oder Dienstes in das Feld Suchen ein. Symbol für das Navigationsmenü und Suchfeld

Aufgabe 1: Dem BigQuery-Dienstkonto IAM-Rollen zuweisen

In dieser Lab-Umgebung wurden mehrere Ressourcen vorab erstellt, darunter eine externe BigQuery-Verbindung namens remote-models-connection und eine BigQuery-Objekttabelle namens image_object_table. Damit können Sie auf unstrukturierte Daten wie Bilder in Cloud Storage zugreifen und sie abfragen. Beim Erstellen der externen Verbindung wurde außerdem automatisch ein BigQuery-Dienstkonto generiert, mit dem der Zugriff auf Ressourcen gesteuert werden kann.

Im Rahmen dieser Aufgabe weisen Sie dem automatisch generierten BigQuery-Dienstkonto bestimmte IAM-Rollen zu, damit es auf die Bilddateien in Cloud Storage und die für die Vektorsuche erforderlichen Vertex AI-Ressourcen zugreifen kann.

Die BigQuery Console öffnen

  1. Klicken Sie in der Google Cloud Console im Navigationsmenü auf BigQuery.

Zuerst wird das Fenster Willkommen bei BigQuery in der Cloud Console geöffnet, das neben allgemeinen Informationen auch einen Link zur Kurzanleitung und zu den Versionshinweisen enthält.

  1. Klicken Sie auf Fertig.

Die BigQuery Console wird geöffnet.

Automatisch generiertes BigQuery-Dienstkonto identifizieren

  1. Klicken Sie auf den Pfeil neben der Projekt-ID () und dann auf den Pfeil neben Verbindungen.

  2. Klicken Sie auf die Verbindung mit dem Namen .remote-models-connection.

  3. Kopieren Sie auf der Seite Verbindungsinformationen die Dienstkonto-ID. Diese brauchen Sie für den nächsten Schritt.

Beispiel: bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com

Dem BigQuery-Dienstkonto IAM-Rollen zuweisen

  1. Klicken Sie in der Google Cloud Console im Navigationsmenü (Symbol für Navigationsmenü) auf IAM und Verwaltung > IAM.

  2. Klicken Sie auf Zugriff erlauben.

  3. Geben Sie unter Neue Hauptkonten die Dienstkonto-ID ein, die Sie im vorherigen Abschnitt kopiert haben (zum Beispiel bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com).

  4. Filtern Sie unter Rolle auswählen nach Vertex AI User und wählen Sie diese Rolle in den Ergebnissen aus.

  5. Klicken Sie auf Weitere Rolle hinzufügen.

  6. Filtern Sie unter Rolle auswählen nach Storage Object Viewer und wählen Sie diese Rolle aus den Ergebnissen aus.

  7. Klicken Sie auf Speichern.

Klicken Sie auf Fortschritt prüfen. Dem BigQuery-Dienstkonto IAM-Rollen zuweisen

Aufgabe 2: BigQuery-Remote-Modell erstellen

Nachdem Sie dem BigQuery-Dienstkonto die erforderlichen Rollen gewährt haben, können Sie ein Remote-Modell in BigQuery erstellen, um auf Vertex AI-Funktionen wie generative KI‑Funktionen zuzugreifen.

Im Rahmen dieser Aufgabe verwenden Sie die externe BigQuery-Verbindung remote-models-connection, um ein Remote-Modell namens embeddings_model zu erstellen, das eine Verbindung zu einem in Vertex AI verfügbaren Einbettungsmodell herstellt. Da Ihre Bilddaten in einem Cloud Storage-Bucket in einem unstrukturierten Format gespeichert sind, möchten Sie ein multimodales Modell als Endpunkt festlegen, um diese Art von Daten effektiv zu verarbeiten.

  1. Klicken Sie in der Google Cloud Console im Navigationsmenü (Symbol für Navigationsmenü) auf BigQuery > Studio.

  2. Fügen Sie im SQL-Abfragefenster die folgende SQL-Abfrage ein, um das BigQuery-Remote-Modell im vorhandenen BigQuery-Dataset mit dem Namen products zu erstellen, und klicken Sie auf Ausführen:

CREATE OR REPLACE MODEL `{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model` REMOTE WITH CONNECTION `{{{project_0.project_id | filled in at lab start}}}.{{{project_0.startup_script.bq_gcp_region | "BigQuery location"}}}.remote-models-connection` OPTIONS( ENDPOINT = '{{{project_0.startup_script.multi_modal_embedding_id | Multimodal embeddings model}}}' ); Hinweis: Wenn im Zusammenhang mit den Dienstkontoberechtigungen, die Sie in der vorherigen Aufgabe zugewiesen haben, ein Fehler ausgegeben wird, warten Sie einige Minuten und führen Sie die Abfrage dann noch einmal aus.

Klicken Sie auf Fortschritt prüfen. BigQuery-Remote-Modell erstellen

Aufgabe 3: Einbettungstabelle für Bilder erstellen, die in einer Objekttabelle aufgeführt sind

Nachdem Sie das Remote-Modell in BigQuery erstellt haben, rufen Sie es auf, um die Einbettungen basierend auf den in Cloud Storage gespeicherten Bilddateien zu generieren. Wie in Aufgabe 1 erwähnt, wurde für diese Lab-Umgebung eine Objekttabelle mit dem Namen image_object_table vorab erstellt, mit der die Bilddateien abgefragt werden können.

Im Rahmen dieser Aufgabe rufen Sie das Einbettungsmodell auf, um es für product_image_object_table auszuführen, und speichern die Ergebnisse in einer neuen Tabelle mit dem Namen product_embeddings. Beim Ausführen der Abfrage sendet BigQuery die Daten in der Objekttabelle an das multimodale Einbettungsmodell, das die Einbettungen zurückgibt, die für Vektorsuchen verwendet werden können, um semantisch ähnliche Entitäten zu finden.

  1. Führen Sie im SQL-Abfragefenster die folgende SQL-Abfrage aus, um die Einbettungstabelle zu erstellen:
CREATE OR REPLACE TABLE `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings` AS SELECT *, REGEXP_EXTRACT(uri, r'[^/]+$') as product_name FROM ML.GENERATE_EMBEDDING ( MODEL `{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`, TABLE `{{{project_0.project_id | filled in at lab start}}}.products.image_object_table` );
  1. Führen Sie im SQL-Abfragefenster die folgende Abfrage aus, um die Daten in der neuen Einbettungstabelle zu prüfen:
SELECT * FROM `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`;

Klicken Sie auf Fortschritt prüfen. Einbettungstabelle für Bilder erstellen, die in einer Objekttabelle aufgeführt sind

Aufgabe 4: Vektorsuche nach Produktbildern in Cloud Storage ausführen

Wie in der Übersicht dieses Labs beschrieben, können Sie mit der Vektorsuche in BigQuery berechnete Einbettungen (numerische Vektoren) verwenden, um semantisch ähnliche Objekte zu finden. Bei der Vektorsuche werden Distanzmesswerte verwendet, die die Distanz zwischen Vektoren in einem Einbettungsbereich darstellen, um sie zu vergleichen und nach Ähnlichkeit zu sortieren. In BigQuery unterstützt die Vektorsuchfunktion drei Distanztypen: euklidisch (Standard), Kosinus und Skalarprodukt.

Im Rahmen dieser Aufgabe verwenden Sie die Kosinus-Ähnlichkeit (den Kosinus des Winkels zwischen zwei Vektoren), um die drei ähnlichsten Produktbilder in Google Cloud Storage für den Suchbegriff bunte Pullover für Damen zu finden.

  • Führen Sie im SQL-Abfragefenster die folgende Abfrage aus, in der die Funktion VECTOR_SEARCH verwendet wird, um in der Tabelle mit den Produkteinbettungen nach den Bildern zu suchen, die dem angegebenen Suchbegriff am ähnlichsten sind:
SELECT base.uri, base.product_name, base.content_type, distance FROM VECTOR_SEARCH(TABLE products.product_embeddings,'ml_generate_embedding_result', ( SELECT ml_generate_embedding_result AS embedding_col FROM ML.GENERATE_EMBEDDING ( MODEL `products.embeddings_model`, (SELECT 'colorful sweaters for women' AS content), STRUCT(TRUE AS flatten_json_output) ) ), TOP_K => 3, DISTANCE_TYPE => 'COSINE' );

Bilder mit der höchsten Übereinstimmung in Cloud Storage ansehen

[Optional] Wenn Sie die Bilder ansehen möchten, die als höchste Übereinstimmung zurückgegeben wurden, können Sie den Cloud Storage-Bucket aufrufen und jedes Bild öffnen.

  1. Wählen Sie in der Google Cloud Console im Navigationsmenü (Symbol für Navigationsmenü) die Option Cloud Storage > Buckets aus.

  2. Klicken Sie auf den Bucket namens und dann auf einen Bildnamen, zum Beispiel Onesie.jpg.

  3. Klicken Sie auf die authentifizierte URL, um das Bild aufzurufen (beispielsweise https://storage.cloud.google.com/qwiklabs-gcp-04-dc2812426125/Onesie.jpg).

Klicken Sie auf Fortschritt prüfen. Vektorsuche nach Produktbildern in Cloud Storage ausführen

Glückwunsch!

In diesem Lab haben Sie eine kurze Einführung in die Vektorsuche in BigQuery erhalten und damit Bilder in Cloud Storage gesucht, die am ehesten zu einem angegebenen Suchbegriff passen.

Weitere Informationen

Google Cloud-Schulungen und -Zertifizierungen

In unseren Schulungen erfahren Sie alles zum optimalen Einsatz unserer Google Cloud-Technologien und können sich entsprechend zertifizieren lassen. Unsere Kurse vermitteln technische Fähigkeiten und Best Practices, damit Sie möglichst schnell mit Google Cloud loslegen und Ihr Wissen fortlaufend erweitern können. Wir bieten On-Demand-, Präsenz- und virtuelle Schulungen für Anfänger wie Fortgeschrittene an, die Sie individuell in Ihrem eigenen Zeitplan absolvieren können. Mit unseren Zertifizierungen weisen Sie nach, dass Sie Experte im Bereich Google Cloud-Technologien sind.

Anleitung zuletzt am 16. März 2026 aktualisiert

Lab zuletzt am 16. März 2026 getestet

© 2026 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.

Vorbereitung

  1. Labs erstellen ein Google Cloud-Projekt und Ressourcen für einen bestimmten Zeitraum
  2. Labs haben ein Zeitlimit und keine Pausenfunktion. Wenn Sie das Lab beenden, müssen Sie von vorne beginnen.
  3. Klicken Sie links oben auf dem Bildschirm auf Lab starten, um zu beginnen

Privates Surfen verwenden

  1. Kopieren Sie den bereitgestellten Nutzernamen und das Passwort für das Lab
  2. Klicken Sie im privaten Modus auf Konsole öffnen

In der Konsole anmelden

  1. Melden Sie sich mit Ihren Lab-Anmeldedaten an. Wenn Sie andere Anmeldedaten verwenden, kann dies zu Fehlern führen oder es fallen Kosten an.
  2. Akzeptieren Sie die Nutzungsbedingungen und überspringen Sie die Seite zur Wiederherstellung der Ressourcen
  3. Klicken Sie erst auf Lab beenden, wenn Sie das Lab abgeschlossen haben oder es neu starten möchten. Andernfalls werden Ihre bisherige Arbeit und das Projekt gelöscht.

Diese Inhalte sind derzeit nicht verfügbar

Bei Verfügbarkeit des Labs benachrichtigen wir Sie per E-Mail

Sehr gut!

Bei Verfügbarkeit kontaktieren wir Sie per E-Mail

Es ist immer nur ein Lab möglich

Bestätigen Sie, dass Sie alle vorhandenen Labs beenden und dieses Lab starten möchten

Privates Surfen für das Lab verwenden

Am besten führen Sie dieses Lab in einem Inkognito- oder privaten Browserfenster aus. So vermeiden Sie Konflikte zwischen Ihrem privaten Konto und dem Teilnehmerkonto, die zusätzliche Kosten für Ihr privates Konto verursachen könnten.