准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
Create a cloud data fusion instance
/ 25
Add Cloud Data Fusion API Service Agent role to service account
/ 25
Deploy a sample pipeline
/ 25
View the result
/ 25
本實驗室將說明如何建立 Data Fusion 執行個體,並部署提供的範例管道。這個管道會從 Cloud Storage 讀取包含《紐約時報》暢銷書資料的 JSON 檔案,接著透過轉換程序剖析及清除資料,最後將部分記錄載入 BigQuery。
本實驗室的學習內容包括:
每個實驗室都會提供新的 Google Cloud 專案和一組資源,讓您在時限內免費使用。
請以無痕視窗登入 Google Skills。
請記下實驗室時間限制 (例如 1:15:00),務必在時限內完成作業。
研究室不提供暫停功能。如有需要,您可以重新開始,但原先的進度恕無法保留。
準備就緒後,請按一下「Start lab」。
請記下研究室憑證 (使用者名稱和密碼),這組資訊將用於登入 Google Cloud 控制台。
按一下「Open Google Console」。
按一下「Use another account」,然後複製這個研究室的憑證,並貼入提示訊息。
如果使用其他憑證,系統會顯示錯誤或向您收取費用。
接受條款,然後略過資源復原頁面。
這個臨時帳戶只在實驗室期間有效,使用時務必遵守下列規定:
Cloud Shell 是含有多項開發工具的虛擬機器,提供永久的 5 GB 主目錄,並在 Google Cloud 中運作。Cloud Shell 可讓您透過指令列存取 Google Cloud 資源。gcloud 是 Google Cloud 的指令列工具,已預先安裝於 Cloud Shell,並支援 Tab 鍵完成功能。
在控制台的右上方,點按「啟用 Cloud Shell」按鈕 。
點按「繼續」。
請稍候片刻,等待系統完成佈建作業並連線至環境。連線建立後,即代表您已通過驗證,且專案已設為「PROJECT_ID」。
輸出內容
輸出內容範例
輸出內容
輸出內容範例
開始使用 Google Cloud 前,請務必確保專案在 Identity and Access Management (IAM) 中具備正確的權限。
前往 Google Cloud 控制台的「導覽選單」,依序點選「IAM 與管理」>「身分與存取權管理」。
確認具有預設的運算服務帳戶 {project-number}-compute@developer.gserviceaccount.com,且已指派 editor 角色。帳戶前置字串為專案編號,如需查看,請前往「導覽選單」>「Cloud 總覽」。
如果帳戶未顯示在 IAM 中,或沒有 editor 角色,請依照下列步驟指派必要角色。
前往 Google Cloud 控制台,依序點選「導覽選單」>「Cloud 總覽」。
從「專案資訊」資訊卡複製「專案編號」。
從「導覽選單」依序點選「IAM 與管理」>「身分與存取權管理」。
點選「身分與存取權管理」頁面頂端的「新增」。
在「新增主體」輸入:
將 {project-number} 換成您的專案編號。
從「請選擇角色」選單依序選取「基本」或「專案」>「編輯者」。
點選「儲存」。
前往 Cloud 控制台,依序點選「導覽選單」圖示 >「API 和服務」>「程式庫」。
在搜尋方塊中輸入 Data fusion,找出 Cloud Data Fusion API 並點按超連結。
這個 API 應為啟用狀態。請依序點選「管理」和「停用 API」,再點選「停用」加以確認。
停用 API 後,點選「啟用」即可重新啟用。
前往 Google Cloud 控制台,依序點選「導覽選單」圖示 >「查看所有產品」。在「數據分析」部分,點選「Data Fusion」。
點選該部分頂端的「建立執行個體」連結,即可建立 Cloud Data Fusion 執行個體。
在載入的「建立 Data Fusion 執行個體」頁面中:
a. 輸入執行個體名稱 (例如 cdf-lab-instance)。
b. 在「區域」中選取 us-central1。
c. 在「版本」下方,選取「基本」。
d. 在「授權」部分,視需要點選「授予權限」。
e. 點選「進階選項」旁的下拉式選單圖示,在「進階監控與記錄功能」底下勾選「Dataproc Cloud Logging」核取方塊。
f. 其餘欄位保持不變,點選「建立」。
點選「Check my progress」,確認目標已達成。
接著請按照下列步驟,授權給執行個體綁定的服務帳戶。
前往 Cloud 控制台,依序點選「導覽選單」圖示 >「IAM 與管理」>「身分與存取權管理」。
在「IAM 權限」頁面中,按一下「+ 授予存取權」。
在「新增主體」欄位,貼上「Dataproc 服務帳戶」。
按一下「選取角色」欄位,輸入並選取「Cloud Data Fusion API 服務代理」。
按一下「儲存」。
點選「Check my progress」,確認目標已達成。
使用 Cloud Data Fusion 時,需要同時操作 Cloud 控制台和獨立的 Cloud Data Fusion UI。
在 Cloud 控制台中,您可以建立及刪除 Cloud Data Fusion 執行個體,也可以查看相關詳細資料。
在 Cloud Data Fusion 網頁 UI 中,您可以透過不同的頁面 (例如「Pipeline Studo」或「Wrangler」) 操作 Cloud Data Fusion 的各項功能。
如要瀏覽 Cloud Data Fusion UI,請按照下列步驟操作:
前往 Cloud 控制台,依序點選「導覽選單」圖示 >「查看所有產品」。在「數據分析」部分,點選「Data Fusion」。
點選 Data Fusion 執行個體旁的「查看執行個體」連結。選取用於登入的實驗室憑證,視需要勾選「管理您的 Google 服務控制資料」旁的核取方塊,然後點按「繼續」。
如果系統請您觀看服務導覽,請點按「取消」。現在應會進入 Cloud Data Fusion UI。
請注意,Cloud Data Fusion 網頁 UI 的左側有專屬導覽面板,方便快速切換至所需頁面。
您可以透過 Cloud Data Fusion Hub 取得範例管道,並分享可重複使用的 Cloud Data Fusion 管道、外掛程式和解決方案。
點按左側面板中的「Pipelines」。
點選「Cloud Data Fusion Quickstart」管道,然後在隨即顯示的彈出式視窗中點選「Create」。
在「Cloud Data Fusion Quickstart」設定面板中,點選「Finish」。
點選「Customize Pipeline」。您的管道示意圖會出現在 Pipeline Studio 中,這是用於開發資料整合管道的圖形介面。左側會列出可用的管道外掛程式,您的管道則顯示在主畫布區域。將游標懸停在個別管道節點上,然後點選隨之出現的「Properties」按鈕,即可瀏覽管道資料。在每個節點的「Properties」選單中,您可以查看相關聯的物件和作業。
部署完成的管道會顯示在管道詳細資料檢視畫面,您可以在這裡執行下列操作:
檢視管道的結構及設定。
手動執行管道,或設定時間表/觸發條件。
查看過往執行記錄的摘要,包括執行時間、記錄檔和指標。
點選「Check my progress」,確認目標已達成。
管道會將輸出內容寫入 BigQuery 資料表,您可以按照下列步驟確認。
點按這個連結,在 Cloud 控制台中開啟 BigQuery UI,或在控制台分頁標籤上按一下滑鼠右鍵,然後選取「複製」。接著點選「導覽選單」圖示 並選取「BigQuery」。
在「傳統版 Explorer」窗格中,點選您的專案 ID (開頭為 qwiklabs)。
在專案的「GCPQuickstart」資料集下方,點選「top_rated_inexpensive」資料表。
點選「+ SQL 查詢」,貼上下列查詢,然後點選「執行」。
點選「Check my progress」,確認目標已達成。
在本實驗室,您已學會如何建立 Data Fusion 執行個體,並成功部署範例管道。這個管道會從 Cloud Storage 讀取輸入檔案,經過資料轉換與篩選後,將部分資料輸出到 BigQuery。
完成實驗室後,請按一下「End Lab」。Google Skills 會移除您使用的資源,並清除所用帳戶。
您可以為實驗室的使用體驗評分。請選取合適的星級評等並提供意見,然後按一下「Submit」。
星級評等代表您的滿意程度:
如果不想提供意見回饋,您可以直接關閉對話方塊。
如有任何想法、建議或指教,請透過「Support」分頁提交。
使用手冊上次更新日期:2025 年 12 月 17 日
實驗室上次測試日期:2025 年 12 月 17 日
Copyright 2026 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验