Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Dataflow API
/ 10
Create a cloud Bigtable instance
/ 15
Create new cloud Bigtable table
/ 15
Load data files from cloud storage using a dataflow template
/ 30
Delete a Bigtable table and instance
/ 10
Bigtable 是可擴充的全代管 Google NoSQL 資料庫服務。如要在鍵/值儲存庫中儲存大量資料,Bigtable 是非常合適的選擇。此外,Bigtable 還可用於個人化服務、廣告技術、金融科技、數位媒體和物聯網 (IoT) 等用途。Bigtable 的延遲時間短且讀寫處理量高,可讓您快速存取大量資料,以便處理及分析。
在個人化應用方面,Bigtable 能處理大量寫入作業來儲存使用者與線上產品的互動資料,也能處理大量讀取作業,將這些互動資料提供給模型,進而生成個人化建議。
在本實驗室中,您將使用 Google Cloud 控制台建立 Bigtable 執行個體和資料表,儲存使用者與產品的互動資料。然後您要使用 Dataflow 範本,將預先產生的 Cloud Storage 資料檔案填入資料表。Dataflow 工作完成後,您要確認已成功在資料表填入資料,接著刪除 Bigtable 資料,完成實驗室。
在本實驗室中,您將瞭解如何建立 Bigtable 執行個體並從 Cloud Storage 載入資料,而不必編寫任何程式碼。
請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。
您將在真正的雲端環境完成實作實驗室活動,而不是模擬或示範環境。為此,我們會提供新的暫時憑證,供您在實驗室活動期間登入及存取 Google Cloud。
為了順利完成這個實驗室,請先確認:
點選「Start Lab」按鈕。如果實驗室會產生費用,畫面上會出現選擇付款方式的對話方塊。左側的「Lab Details」窗格會顯示下列項目:
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」。
接著,實驗室會啟動相關資源,並開啟另一個分頁,顯示「登入」頁面。
提示:您可以在不同的視窗中並排開啟分頁。
如有必要,請將下方的 Username 貼到「登入」對話方塊。
您也可以在「Lab Details」窗格找到 Username。
點選「下一步」。
複製下方的 Password,並貼到「歡迎使用」對話方塊。
您也可以在「Lab Details」窗格找到 Password。
點選「下一步」。
按過後續的所有頁面:
Google Cloud 控制台稍後會在這個分頁開啟。
Cloud Shell 是搭載多項開發工具的虛擬機器,提供永久的 5 GB 主目錄,而且在 Google Cloud 中運作。Cloud Shell 提供指令列存取權,方便您使用 Google Cloud 資源。
點按 Google Cloud 控制台頂端的「啟用 Cloud Shell」圖示 。
系統顯示視窗時,請按照下列步驟操作:
連線建立完成即代表已通過驗證,而且專案已設為您的 Project_ID:
gcloud 是 Google Cloud 的指令列工具,已預先安裝於 Cloud Shell,並支援 Tab 鍵自動完成功能。
輸出內容:
輸出內容:
gcloud 的完整說明,請前往 Google Cloud 參閱 gcloud CLI 總覽指南。
請重新啟動連至 Dataflow API 的連線,確保可順利使用這個必要的 API。
點選「Check my progress」,確認目標已達成。
如要在 Bigtable 建立新資料表,首先需建立 Bigtable 執行個體來儲存資料表。
在 Google Cloud 控制台的「導覽選單」() 中,點選「資料庫」下方的「Bigtable」。
點選「建立執行個體」。
輸入必要資訊來建立 Bigtable 執行個體:
| 屬性 | 值 |
|---|---|
| 執行個體名稱 | Personalized Sales |
| 執行個體 ID | 保留預設值。 |
| 儲存空間類型 | SSD |
| 叢集 ID | 保留預設值。 |
| 區域 | |
| 可用區 | |
| 節點資源調度模式 | 手動分配 |
| 數量 | 保留預設值。 |
點選「Check my progress」,確認目標已達成。
Bigtable 資料表會為每一列提供專屬 ID,稱為「資料列索引鍵」,並將相關資料欄歸類為「資料欄系列」。在這項工作中,您將建立新的 Bigtable 資料表並設定適當的資料列索引鍵和資料欄系列,來儲存使用者互動資料。
首先,您將建立 UserSessions 資料表,並結合使用者 ID 與時間戳記做為資料列索引鍵,來儲存使用者在線上與各種產品互動的資料,以及已確認的銷售活動。然後您要建立兩個資料欄系列 Interactions 和 Sales,以彙整相關資料欄。
在 Bigtable 執行個體清單中,點選執行個體 ID「personalized-sales」。
在導覽選單中,點選「執行個體」下方的「資料表」。
點選「建立資料表」。
在「資料表 ID」部分,輸入 UserSessions。
點選「新增資料欄系列」。
在「資料欄系列名稱」部分,輸入 Interactions
保留垃圾回收政策的預設值。
點選「完成」。
重複步驟 5 至 7,建立另一個資料欄系列並命名為 Sales。
點選「建立」。
點選「Check my progress」,確認目標已達成。
在這項工作中,您會執行 Dataflow 工作,將 Cloud Storage 資料載入 Bigtable。為了成功執行 Dataflow 工作,您必須先建立 Cloud Storage bucket,讓 Dataflow 能視需要寫入暫存檔案。這樣一來,就能順利透過範本建立及執行新的 Dataflow 工作。
前往 Google Cloud 控制台的「導覽選單」(),依序點選「Cloud 總覽」>「資訊主頁」。
在「專案資訊」下方,複製「專案 ID」的值 (例如
您將使用 Qwiklabs 專案 ID (該 ID 已是全域不重複),做為 Cloud Storage bucket 名稱。
前往 Google Cloud 控制台的「導覽選單」(),依序點選「Cloud Storage」>「bucket」。
點選「建立 bucket」。
輸入必要資訊來建立 Cloud Storage bucket,並將「project-id」替換成您在步驟 2 複製的專案 ID。
| 屬性 | 值 |
|---|---|
| 名稱 | project-id |
| 位置類型 | Multi-region |
| 位置 | us (多個美國區域) |
保留其餘參數的預設值。
點選「建立」。
如果出現「系統會禁止公開存取」的提示訊息,請點選「確認」。
前往 Google Cloud 控制台的「導覽選單」(),在「數據分析」下方依序點選「Dataflow」>「工作」。
點選「利用範本建立工作」。
輸入必要資訊以使用範本建立 Dataflow 工作,並將「project-id」替換成您先前複製的專案 ID。
| 屬性 | 值 |
|---|---|
| 工作名稱 | import-usersessions |
| 區域端點 | |
| Dataflow 範本 | 從 Cloud Storage 載入 Cloud Bigtable 的 SequenceFile 檔案 |
| 專案 ID | project-id |
| 執行個體 ID | personalized-sales |
| 資料表 ID | UserSessions |
| 來源路徑模式 | gs://spls/gsp1054/retail-interactions-sales-00000-of-00001 |
| 臨時位置 | gs://project-id/temp |
保留其餘參數的預設值。
點按「執行工作」。
在「工作圖表」頁面的「工作步驟檢視畫面」下方,選取「圖表檢視」。
「圖表檢視」會顯示圖表,說明完成下列工作步驟的進度:
當「工作圖表」中的每個任務成功完成,旁邊就會顯示綠色勾號,表示任務狀態為「成功」。這項工作約需 3 到 5 分鐘才能順利執行完畢。
點選「Check my progress」,確認目標已達成。
Dataflow 工作成功完成後,您可以使用 cbt (Cloud Bigtable 指令列工具) 指令 連線至 Bigtable 執行個體,確認資料表已填入資料。
您必須先透過 Cloud Shell,將 .cbtrc 設定檔改成您的專案 ID 和 Bigtable 執行個體 ID,才能使用 cbt CLI 指令連線至 Bigtable。
如要複習 Cloud Shell 的存取方式,請點選本頁右側選單中的「設定和需求」。
.cbtrc 檔案:.cbtrc 檔案:輸出內容大致如下:
在 Cloud Shell 設定 .cbtrc 設定檔後,即可執行簡單的 cbt CLI 指令,查詢資料表的前十筆記錄。
輸出內容的結構如下:
輸出值大致如下:
在 Google Cloud 控制台的「導覽選單」() 中,點選「資料庫」下方的「Bigtable」。
在 Bigtable 執行個體清單中,點選執行個體 ID「personalized-sales」。
在導覽選單中,點選「執行個體」下方的「資料表」。
點選資料表「UserSessions」。
點選「刪除資料表」。
在確認對話方塊中,輸入 UserSessions。
點選「刪除」。
在導覽選單中,點選「執行個體」下方的「總覽」。
點選「刪除執行個體」。
在確認對話方塊中,輸入 personalized-sales。
點選「刪除」。
點選「Check my progress」,確認目標已達成。
在本實驗室中,您學會使用 Bigtable 建立新的執行個體和資料表,使用 Dataflow 範本將資料載入資料表,以及執行簡單的 cbt CLI 指令,來確認已成功載入資料。最後,您刪除了 Bigtable 資料表和執行個體,順利完成實驗室。
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2025 年 8 月 13 日
實驗室上次測試日期:2025 年 8 月 13 日
Copyright 2025 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
This content is not currently available
We will notify you via email when it becomes available
Great!
We will contact you via email if it becomes available
One lab at a time
Confirm to end all existing labs and start this one