准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
Dataflow API
/ 10
Create a cloud Bigtable instance
/ 15
Create new cloud Bigtable table
/ 15
Load data files from cloud storage using a dataflow template
/ 30
Delete a Bigtable table and instance
/ 10
Bigtable 是可擴充的全代管 Google NoSQL 資料庫服務。如要在鍵/值儲存庫中儲存大量資料,Bigtable 是非常合適的選擇。此外,Bigtable 還可用於個人化服務、廣告技術、金融科技、數位媒體和物聯網 (IoT) 等用途。Bigtable 的延遲時間短且讀寫處理量高,可讓您快速存取大量資料,以便處理及分析。
在個人化應用方面,Bigtable 能處理大量寫入作業來儲存使用者與線上產品的互動資料,也能處理大量讀取作業,將這些互動資料提供給模型,進而生成個人化建議。
在本實驗室中,您將使用 Google Cloud 控制台建立 Bigtable 執行個體和資料表,儲存使用者與產品的互動資料。然後您要使用 Dataflow 範本,將預先產生的 Cloud Storage 資料檔案填入資料表。Dataflow 工作完成後,您要確認已成功在資料表填入資料,接著刪除 Bigtable 資料,完成實驗室。
在本實驗室中,您將瞭解如何建立 Bigtable 執行個體並從 Cloud Storage 載入資料,而不必編寫任何程式碼。
請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。
您將在真正的雲端環境完成實作實驗室活動,而不是模擬或示範環境。為此,我們會提供新的暫時憑證,供您在實驗室活動期間登入及存取 Google Cloud。
為了順利完成這個實驗室,請先確認:
點選「Start Lab」按鈕。如果實驗室會產生費用,畫面上會出現選擇付款方式的對話方塊。左側的「Lab Details」窗格會顯示下列項目:
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」。
接著,實驗室會啟動相關資源,並開啟另一個分頁,顯示「登入」頁面。
提示:您可以在不同的視窗中並排開啟分頁。
如有必要,請將下方的 Username 貼到「登入」對話方塊。
您也可以在「Lab Details」窗格找到 Username。
點選「下一步」。
複製下方的 Password,並貼到「歡迎使用」對話方塊。
您也可以在「Lab Details」窗格找到 Password。
點選「下一步」。
按過後續的所有頁面:
Google Cloud 控制台稍後會在這個分頁開啟。
Cloud Shell 是搭載多項開發工具的虛擬機器,提供永久的 5 GB 主目錄,而且在 Google Cloud 中運作。Cloud Shell 提供指令列存取權,方便您使用 Google Cloud 資源。
點按 Google Cloud 控制台頂端的「啟用 Cloud Shell」圖示 。
系統顯示視窗時,請按照下列步驟操作:
連線建立完成即代表已通過驗證,而且專案已設為您的 Project_ID:
gcloud 是 Google Cloud 的指令列工具,已預先安裝於 Cloud Shell,並支援 Tab 鍵自動完成功能。
輸出內容:
輸出內容:
gcloud 的完整說明,請前往 Google Cloud 參閱 gcloud CLI 總覽指南。
請重新啟動連至 Dataflow API 的連線,確保可順利使用這個必要的 API。
點選「Check my progress」,確認目標已達成。
如要在 Bigtable 建立新資料表,首先需建立 Bigtable 執行個體來儲存資料表。
在 Google Cloud 控制台的「導覽選單」() 中,點選「資料庫」下方的「Bigtable」。
點選「建立執行個體」。
輸入必要資訊來建立 Bigtable 執行個體:
| 屬性 | 值 |
|---|---|
| 執行個體名稱 | Personalized Sales |
| 執行個體 ID | 保留預設值。 |
| 儲存空間類型 | SSD |
| 叢集 ID | 保留預設值。 |
| 區域 | |
| 可用區 | |
| 節點資源調度模式 | 手動分配 |
| 數量 | 保留預設值。 |
點選「Check my progress」,確認目標已達成。
Bigtable 資料表會為每一列提供專屬 ID,稱為「資料列索引鍵」,並將相關資料欄歸類為「資料欄系列」。在這項工作中,您將建立新的 Bigtable 資料表並設定適當的資料列索引鍵和資料欄系列,來儲存使用者互動資料。
首先,您將建立 UserSessions 資料表,並結合使用者 ID 與時間戳記做為資料列索引鍵,來儲存使用者在線上與各種產品互動的資料,以及已確認的銷售活動。然後您要建立兩個資料欄系列 Interactions 和 Sales,以彙整相關資料欄。
在 Bigtable 執行個體清單中,點選執行個體 ID「personalized-sales」。
在導覽選單中,點選「執行個體」下方的「資料表」。
點選「建立資料表」。
在「資料表 ID」部分,輸入 UserSessions。
點選「新增資料欄系列」。
在「資料欄系列名稱」部分,輸入 Interactions
保留垃圾回收政策的預設值。
點選「完成」。
重複步驟 5 至 7,建立另一個資料欄系列並命名為 Sales。
點選「建立」。
點選「Check my progress」,確認目標已達成。
在這項工作中,您會執行 Dataflow 工作,將 Cloud Storage 資料載入 Bigtable。為了成功執行 Dataflow 工作,您必須先建立 Cloud Storage bucket,讓 Dataflow 能視需要寫入暫存檔案。這樣一來,就能順利透過範本建立及執行新的 Dataflow 工作。
前往 Google Cloud 控制台的「導覽選單」(),依序點選「Cloud 總覽」>「資訊主頁」。
在「專案資訊」下方,複製「專案 ID」的值 (例如
您將使用 Qwiklabs 專案 ID (該 ID 已是全域不重複),做為 Cloud Storage bucket 名稱。
前往 Google Cloud 控制台的「導覽選單」(),依序點選「Cloud Storage」>「bucket」。
點選「建立 bucket」。
輸入必要資訊來建立 Cloud Storage bucket,並將「project-id」替換成您在步驟 2 複製的專案 ID。
| 屬性 | 值 |
|---|---|
| 名稱 | project-id |
| 位置類型 | Multi-region |
| 位置 | us (多個美國區域) |
保留其餘參數的預設值。
點選「建立」。
如果出現「系統會禁止公開存取」的提示訊息,請點選「確認」。
前往 Google Cloud 控制台的「導覽選單」(),在「數據分析」下方依序點選「Dataflow」>「工作」。
點選「利用範本建立工作」。
輸入必要資訊以使用範本建立 Dataflow 工作,並將「project-id」替換成您先前複製的專案 ID。
| 屬性 | 值 |
|---|---|
| 工作名稱 | import-usersessions |
| 區域端點 | |
| Dataflow 範本 | 從 Cloud Storage 載入 Cloud Bigtable 的 SequenceFile 檔案 |
| 專案 ID | project-id |
| 執行個體 ID | personalized-sales |
| 資料表 ID | UserSessions |
| 來源路徑模式 | gs://spls/gsp1054/retail-interactions-sales-00000-of-00001 |
| 臨時位置 | gs://project-id/temp |
保留其餘參數的預設值。
點按「執行工作」。
在「工作圖表」頁面的「工作步驟檢視畫面」下方,選取「圖表檢視」。
「圖表檢視」會顯示圖表,說明完成下列工作步驟的進度:
當「工作圖表」中的每個任務成功完成,旁邊就會顯示綠色勾號,表示任務狀態為「成功」。這項工作約需 3 到 5 分鐘才能順利執行完畢。
點選「Check my progress」,確認目標已達成。
Dataflow 工作成功完成後,您可以使用 cbt (Cloud Bigtable 指令列工具) 指令 連線至 Bigtable 執行個體,確認資料表已填入資料。
您必須先透過 Cloud Shell,將 .cbtrc 設定檔改成您的專案 ID 和 Bigtable 執行個體 ID,才能使用 cbt CLI 指令連線至 Bigtable。
如要複習 Cloud Shell 的存取方式,請點選本頁右側選單中的「設定和需求」。
.cbtrc 檔案:.cbtrc 檔案:輸出內容大致如下:
在 Cloud Shell 設定 .cbtrc 設定檔後,即可執行簡單的 cbt CLI 指令,查詢資料表的前十筆記錄。
輸出內容的結構如下:
輸出值大致如下:
在 Google Cloud 控制台的「導覽選單」() 中,點選「資料庫」下方的「Bigtable」。
在 Bigtable 執行個體清單中,點選執行個體 ID「personalized-sales」。
在導覽選單中,點選「執行個體」下方的「資料表」。
點選資料表「UserSessions」。
點選「刪除資料表」。
在確認對話方塊中,輸入 UserSessions。
點選「刪除」。
在導覽選單中,點選「執行個體」下方的「總覽」。
點選「刪除執行個體」。
在確認對話方塊中,輸入 personalized-sales。
點選「刪除」。
點選「Check my progress」,確認目標已達成。
在本實驗室中,您學會使用 Bigtable 建立新的執行個體和資料表,使用 Dataflow 範本將資料載入資料表,以及執行簡單的 cbt CLI 指令,來確認已成功載入資料。最後,您刪除了 Bigtable 資料表和執行個體,順利完成實驗室。
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2025 年 8 月 13 日
實驗室上次測試日期:2025 年 8 月 13 日
Copyright 2025 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验