使用 Vector Search 建立混合型搜尋

Install packages, and configure the notebook.

Check my progress

/ 15

Prepare the dataset

Check my progress

/ 15

Use token based search

Check my progress

/ 15

Create an index endpoint and sparse embedding index in Vector Search

Check my progress

/ 15

Create the hybrid index and deploy it to the Endpoint

Check my progress

/ 20

Run a hybrid query

Check my progress

/ 20

This lab may incorporate AI tools to support your learning.

GSP1297

Google Cloud 自學實驗室

總覽

Vector Search 支援混合型搜尋，這是資訊檢索 (IR) 領域常用的架構模式，結合語意搜尋與關鍵字搜尋 (也稱為「詞元型搜尋」)。開發人員可以運用混合型搜尋，結合兩種做法的優勢，有效提高搜尋品質。

這個實驗室會說明如何使用 Google 商品資料集，對產品執行混合型搜尋。完成之後，您會比較混合型搜尋與詞元型搜尋的結果。

啟動實驗室時，環境中會有下方圖表顯示的資源。

實驗室啟動時提供的架構。

完成實驗室活動時，您會運用這個架構執行多項工作。

完成實驗室活動時，您用來建構內容的架構。

下表詳細說明個別工作與實驗室架構的關聯。

有編號的工作	詳細資料
1.	在 Agent Platform Workbench 開啟筆記本，然後選取核心。
2.	安裝套件，並為專案設定筆記本：您會使用 Google Gen AI SDK，透過 Developer API 和 Agent Platform 使用文字嵌入模型。您需要安裝 Python 程式庫，並在整個實驗室活動中參考。您也需要設定筆記本，以便存取專案中的資源，例如實驗室啟動時提供的 Cloud Storage bucket。
3.	準備資料集：在這項工作，您會下載內含 Google 商品品項的資料集 .csv 檔案，並新增至 Pandas DataFrame。
4.	執行詞元型搜尋：您會訓練向量化工具，該模型會從文字生成稀疏嵌入，讓您套用至資料集。
5.	建立索引端點：您必須建立索引端點，才能在 Vector Search 使用混合型搜尋。
6.	建立混合型查詢索引並部署至端點：您會使用「text-embedding-005」模型，為資料集項目生成稠密嵌入，然後結合稀疏嵌入來建立混合型索引。完成之後，您會將混合型索引部署至端點。
7.	執行混合型查詢：部署索引之後，您必須先建立 HybridQuery 物件，封裝查詢文字的稀疏嵌入，接著才能執行查詢。

事前準備

開始這個實驗室之前，您應已熟悉下列概念：

基本 Python 程式設計。
一般 API 概念。
在 Agent Platform Workbench 使用 Jupyter 筆記本執行 Python 程式碼。

目標

這個實驗室的內容如下：

在 Vector Search 使用混合型搜尋。
建立並部署混合型搜尋索引。
查詢混合型搜尋索引。

設定和需求

瞭解以下事項後，再點選「Start Lab」按鈕

請詳閱以下操作說明。實驗室活動會計時，且中途無法暫停。點選「Start Lab」後就會開始計時，顯示可使用 Google Cloud 資源的時間。

您將在真正的雲端環境完成實作實驗室活動，而不是模擬或示範環境。為此，我們會提供新的暫時憑證，供您在實驗室活動期間登入及存取 Google Cloud。

為了順利完成這個實驗室，請先確認：

可以使用標準的網際網路瀏覽器 (Chrome 瀏覽器為佳)。

注意事項：請使用無痕模式 (建議選項) 或私密瀏覽視窗執行此實驗室，這可以防止個人帳戶和學員帳戶之間的衝突，避免個人帳戶產生額外費用。

是時候完成實驗室活動了！別忘了，活動一旦開始將無法暫停。

注意事項：務必使用實驗室專用的學員帳戶。如果使用其他 Google Cloud 帳戶，可能會產生額外費用。

如何開始研究室及登入 Google Cloud 控制台

點選「Start Lab」按鈕。如果實驗室會產生費用，畫面上會出現選擇付款方式的對話方塊。左側的「Lab Details」窗格會顯示下列項目：
- 「Open Google Cloud console」按鈕
- 剩餘時間
- 必須在這個研究室中使用的臨時憑證
- 完成這個實驗室所需的其他資訊 (如有)
點選「Open Google Cloud console」；如果使用 Chrome 瀏覽器，也能按一下滑鼠右鍵，選取「在無痕視窗中開啟連結」。

接著，實驗室會啟動相關資源，並開啟另一個分頁，顯示「登入」頁面。

提示：您可以在不同的視窗中並排開啟分頁。
注意：如果頁面中顯示「選擇帳戶」對話方塊，請點選「使用其他帳戶」。
如有必要，請將下方的 Username 貼到「登入」對話方塊。
{{{user_0.username | "Username"}}}
您也可以在「Lab Details」窗格找到 Username。
點選「下一步」。
複製下方的 Password，並貼到「歡迎使用」對話方塊。
{{{user_0.password | "Password"}}}
您也可以在「Lab Details」窗格找到 Password。
點選「下一步」。
重要事項：請務必使用實驗室提供的憑證，而非自己的 Google Cloud 帳戶憑證。注意：如果使用自己的 Google Cloud 帳戶來進行這個實驗室，可能會產生額外費用。
按過後續的所有頁面：
- 接受條款及細則。
- 由於這是臨時帳戶，請勿新增救援選項或雙重驗證機制。
- 請勿申請免費試用。

Google Cloud 控制台稍後會在這個分頁開啟。

注意：如要使用 Google Cloud 產品和服務，請點選「導覽選單」，或在「搜尋」欄位輸入服務或產品名稱。「導覽選單」圖示和搜尋欄位

工作 1：在 Agent Platform Workbench 開啟筆記本並選取核心

前往 Google Cloud 控制台，依序點按「導覽選單」圖示 >「Agent Platform」>「Notebooks」。
在左側導覽列中，點擊 Workbench。
找出執行個體，點按「Open JupyterLab」按鈕。

Workbench 執行個體的 JupyterLab 介面會在新瀏覽器分頁開啟。

注意：如果在 JupyterLab 沒有看見筆記本，請按照以下額外步驟重設執行個體：

1. 關閉 JupyterLab 的瀏覽器分頁，回到 Workbench 首頁。

2. 勾選執行個體名稱旁的核取方塊，然後點按「重設」。

3. 「開啟 JupyterLab」按鈕再次啟用後，等待一分鐘，然後點按「開啟 JupyterLab」。

開啟檔案。
出現「Select Kernel」對話方塊時，從可用核心清單中選取「Python 3」。

工作 2：安裝套件並設定筆記本

為開始使用筆記本，請從第 1 節「建立稀疏嵌入」著手。

在這項工作，您會安裝必要的 Python 套件、重新啟動核心執行階段、將筆記本設為使用您的專案和區域，並匯入程式庫。

填寫工作 2 安裝套件並設定筆記本中的儲存格。

如未自動填入，請將「專案 ID」設為「」，並將「位置」設為「」。

點選「Check my progress」，確認目標已達成。安裝套件並設定筆記本。

工作 3：準備資料集

在這項工作，您會下載並準備資料集 .csv 檔案，以便在筆記本使用。

在筆記本填寫工作 3 準備資料集的所有儲存格。

點選「Check my progress」，確認目標已達成。準備資料集。

工作 4：建立稀疏嵌入

在這項工作，您會建立稀疏嵌入，並在資料集搜尋「Chrome Dino Pin」商品，取得向量值和維度。您也會擷取資料集內其他產品的值。接著，您會將這些資料儲存至 Workbench 中的 items.json 檔案，並將這個檔案複製到 Cloud Storage bucket。

執行筆記本的所有建立稀疏嵌入工作。

點選「Check my progress」，確認目標已達成。建立稀疏嵌入。

工作 5：建立索引端點

請前往筆記本的第 2 節，開始使用混合型搜尋。

首先，您會在第 5 項工作建立索引端點。

執行筆記本的所有建立索引端點工作。

點選「Check my progress」，確認目標已達成。建立索引端點。

工作 6：建立混合型索引並部署至端點

在這項工作，您會擷取文字嵌入模型，針對一項商品執行稠密嵌入的範例查詢，再針對所有商品執行。接著，您會將這些資料儲存在 items.json 檔案，然後依據該檔案建立混合型索引，並將索引部署至端點。

執行筆記本的所有建立混合型索引並部署至端點工作。

注意事項：混合型索引約需 4 至 5 分鐘才能建立完畢。

注意事項：混合型索引需要 30 分鐘才能部署完成。

在等待混合型索引部署期間，您可以依序前往「Agent Platform」>「Vector Search」>「索引端點」查看部署進度。

您也可以花一些時間查看這項示範。這項示範提供實際範例，讓您瞭解 Vector Search 的運作方式、認識語意和混合型搜尋，以及查看實際的重新排名情形。只要提交動物、植物、電子商務商品或其他物品的簡短說明，Vector Search 就能完成剩餘步驟！

重要事項：您必須依序前往「Agent Platform」>「Vector Search」使用 Vector Search，並存取列出的索引和索引端點。資源建立完畢之後，狀態會隨之改變。

點選「Check my progress」，確認目標已達成。建立混合型索引並部署至端點。

工作 7：執行混合型查詢

在這項工作，您會使用剛剛部署的混合型索引執行混合型查詢，並比較這項查詢與稀疏嵌入查詢的結果。

執行筆記本的所有執行混合型查詢工作。

點選「Check my progress」，確認目標已達成。執行混合型查詢。

恭喜！

在這個實驗室，您學會如何在 Vector Search 使用混合型搜尋，包括建立並部署混合型搜尋索引，以及查詢索引，與稀疏嵌入相比較。

後續行動/瞭解詳情

歡迎參考下列資源，進一步瞭解 Gemini：

Gemini 簡介
Vertex AI 生成式 AI 說明文件
透過 YouTube 瞭解生成式 AI
探索 Vertex AI 教戰手冊，瀏覽及搜尋眾多精心挑選的生成式 AI 筆記本。
前往 Google Cloud 生成式 AI 存放區，查看其他筆記本和範例。

Google Cloud 教育訓練與認證

協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法，讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程，並有隨選、線上和虛擬課程等選項，方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。

使用手冊上次更新日期：2025 年 11 月 11 日

實驗室上次測試日期：2025 年 11 月 11 日

GSP1297

總覽

事前準備

目標

設定和需求

瞭解以下事項後，再點選「Start Lab」按鈕

如何開始研究室及登入 Google Cloud 控制台

工作 1：在 Agent Platform Workbench 開啟筆記本並選取核心

工作 2：安裝套件並設定筆記本

工作 3：準備資料集

工作 4：建立稀疏嵌入

工作 5：建立索引端點

工作 6：建立混合型索引並部署至端點

工作 7：執行混合型查詢

恭喜！

後續行動/瞭解詳情

Google Cloud 教育訓練與認證

Before you begin

Use private browsing

Sign in to the Console

Use private browsing to run the lab