
准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
Create a lake, zone, and asset in Dataplex
/ 30
Create an aspect type
/ 30
Add an aspect to assets
/ 40
Dataplex 是智慧型的 data fabric,有助於組織集中探索、管理、監控及治理 data lake、data warehouse 和資料市集內的資料,以便大規模分析數據。
Data Catalog 是 Dataplex 中可擴充的全代管中繼資料管理服務,能用於標記資料資產,以及搜尋您有權存取的資產。您可以運用標記,將自訂中繼資料欄位附加到特定資料資產 (例如將某些資產標記為私密/機密或受保護的資料),輕鬆識別及擷取內容。此外,還能建立可重複使用的標記範本,快速指派相同標記給不同資料資產。
本研究室將說明如何透過 Dataplex 中的 Data Catalog,建立標記範本、將範本套用至 Dataplex 資產,並使用標記搜尋資產。
請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。
您將在真正的雲端環境完成實作實驗室活動,而不是模擬或示範環境。為此,我們會提供新的暫時憑證,供您在實驗室活動期間登入及存取 Google Cloud。
為了順利完成這個實驗室,請先確認:
點選「Start Lab」按鈕。如果實驗室會產生費用,畫面上會出現選擇付款方式的對話方塊。左側的「Lab Details」窗格會顯示下列項目:
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」。
接著,實驗室會啟動相關資源,並開啟另一個分頁,顯示「登入」頁面。
提示:您可以在不同的視窗中並排開啟分頁。
如有必要,請將下方的 Username 貼到「登入」對話方塊。
您也可以在「Lab Details」窗格找到 Username。
點選「下一步」。
複製下方的 Password,並貼到「歡迎使用」對話方塊。
您也可以在「Lab Details」窗格找到 Password。
點選「下一步」。
按過後續的所有頁面:
Google Cloud 控制台稍後會在這個分頁開啟。
在 Google Cloud 控制台頂端的搜尋列中,輸入 Cloud Dataplex API。
點選「Marketplace」下方的「Cloud Dataplex API」搜尋結果。
如果 API 尚未啟用,請點選「啟用」。
重複步驟 1 至 3 來啟用 Google Cloud Data Catalog API。
在這項工作中,您將建立新的 Dataplex 湖泊來儲存消費者訂單資訊、在湖泊中新增收錄的可用區,然後附加預先建立的 BigQuery 資料集,做為可用區中的新資產。
如果出現「歡迎使用新版 Dataplex 服務」提示訊息,請點選「關閉」。
在「管理 lake」下方,點選「管理」。
點選「建立」。
輸入必要資訊來建立新的 lake:
屬性 | 值 |
---|---|
顯示名稱 | Orders Lake |
ID | 保留預設值。 |
區域 |
其他設定則維持預設值。
lake 應該會在幾分鐘內建立。
在「管理」分頁中,點選湖泊名稱。
點選「新增可用區」。
輸入必要資訊來建立新的可用區:
屬性 | 值 |
---|---|
顯示名稱 | Customer Curated Zone |
ID | 保留預設值。 |
類型 | 收錄的可用區 |
資料位置 | 區域性 |
其他設定則維持預設值。
舉例來說,「探索功能設定」下方的「啟用中繼資料探索功能」選項預設為啟用,可讓獲授權的使用者探索該可用區中的資料。
可用區應該會在幾分鐘內建立。
在「可用區」分頁中,點選可用區名稱。
在「資產」分頁中,點選「新增資產」。
點選「Add an asset」。
輸入必要資訊來連結新資產:
屬性 | 值 |
---|---|
類型 | BigQuery 資料集 |
顯示名稱 | Customer Details Dataset |
ID | 保留預設值。 |
資料集 |
|
其他設定則維持預設值。
點選「繼續」。
在「探索功能設定」部分,選取「繼承」來繼承可用區層級的探索設定,然後點選「繼續」。
點選「提交」。
請先建立一或多個標記範本,才能開始標記資料。標記範本可以是公開或私人範本。當您建立新的標記範本時,預設的建議選項為建立公開範本。如果使用者具有資料資產的必要查看權限,即可檢視與該資產相關聯的所有公開標記。這有助於簡化探索內容的搜尋作業,同時一併遵循基礎資料已採用的資料存取權控管機制。
在這項工作中,您將建立公開標記範本,將 BigQuery 資料表的資料欄標記為受保護狀態。如果使用者可以存取基礎 BigQuery 資料表的資料欄,使用公開標記範本時即可查看套用至資料欄的標記。
在左選單中的「管理中繼資料」下方,點選「Catalog」。
點選「建立標記範本 (Deprecated)」。
看見「確定要繼續嗎?」的提示訊息時,點選「繼續」。
屬性 | 值 |
---|---|
範本顯示名稱 | Protected Data Template |
範本 ID | 保留預設值。 |
位置 | |
瀏覽權限 | 公開 |
屬性 | 值 |
---|---|
欄位顯示名稱 | Protected Data Flag |
欄位 ID | 保留預設值。 |
類型 | 列舉 |
在「列舉值」下方的「值 1」欄位中輸入 YES
。
點選「新增值」,並在「值 2」欄位中輸入 NO
。
按一下「完成」。
點選「建立」。
建立標記範本後,即可使用範本,將標記套用到您有權存取的所需資料資產 (數量不限)。
在這項工作中,您會將先前建立的標記範本,套用到 BigQuery 資料表中要標記為受保護資料狀態的特定資料欄。
在左選單中,點選「探索」下方的「搜尋」。
在「篩選器」下方的「系統」部分,勾選「Dataplex」核取方塊。
按一下 customer_details 資料表。
如果找不到 customer_details 資料表,請先稍等幾分鐘再重新整理頁面,讓系統更新 Dataplex 資產清單。
按一下「附加標記」。
在「選擇要加上標記的內容」下方選單中,勾選下列資料欄的核取方塊:
按一下「確定」。
在「選擇標記範本」下方選單中,選取「Protected Data Template」。
在「Protected Data Flag」下方選單中,選取「YES」。
點選「儲存」。
標記資料資產後,即可使用 Dataplex 中的 Data Catalog,搜尋這些資產。
在這項工作中,您將搜尋已套用 Protected Data 標記範本的資產。
在左選單中,點選「探索」下方的「搜尋」。
在「篩選器」下方的「標記」部分,勾選「Protected Data Template」核取方塊。
按一下 customer_details 資料表。
點選「結構定義與資料欄標記」分頁標籤,查看指定資料欄的 Protected Data 標記。
您已透過 Dataplex 中的 Data Catalog 建立標記範本、將範本套用至 Dataplex 資產,並依據標記搜尋資產。
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2025 年 5 月 23 日
實驗室上次測試日期:2025 年 5 月 23 日
Copyright 2025 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验