arrow_back

標記 Dataplex 資產

登录 加入
访问 700 多个实验和课程

標記 Dataplex 資產

实验 45 分钟 universal_currency_alt 1 积分 show_chart 入门级
info 此实验可能会提供 AI 工具来支持您学习。
访问 700 多个实验和课程

GSP1145

Google Cloud 自學實驗室標誌

總覽

Dataplex 是智慧型的 data fabric,有助於組織集中探索、管理、監控及治理 data lake、data warehouse 和資料市集內的資料,以便大規模分析數據。

Data Catalog 是 Dataplex 中可擴充的全代管中繼資料管理服務,能用於標記資料資產,以及搜尋您有權存取的資產。您可以運用標記,將自訂中繼資料欄位附加到特定資料資產 (例如將某些資產標記為私密/機密或受保護的資料),輕鬆識別及擷取內容。此外,還能建立可重複使用的標記範本,快速指派相同標記給不同資料資產。

本研究室將說明如何透過 Dataplex 中的 Data Catalog,建立標記範本、將範本套用至 Dataplex 資產,並使用標記搜尋資產。

學習目標

  • 啟用 Dataplex API 和 Data Catalog API
  • 在 Dataplex 中建立湖泊、可用區和資產
  • 建立標記範本
  • 將標記範本套用至 Dataplex 資產
  • 使用標記搜尋資產

設定和需求

瞭解以下事項後,再點選「Start Lab」按鈕

請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。

您將在真正的雲端環境完成實作實驗室活動,而不是模擬或示範環境。為此,我們會提供新的暫時憑證,供您在實驗室活動期間登入及存取 Google Cloud。

為了順利完成這個實驗室,請先確認:

  • 可以使用標準的網際網路瀏覽器 (Chrome 瀏覽器為佳)。
注意事項:請使用無痕模式 (建議選項) 或私密瀏覽視窗執行此實驗室,這可以防止個人帳戶和學員帳戶之間的衝突,避免個人帳戶產生額外費用。
  • 是時候完成實驗室活動了!別忘了,活動一旦開始將無法暫停。
注意事項:務必使用實驗室專用的學員帳戶。如果使用其他 Google Cloud 帳戶,可能會產生額外費用。

如何開始研究室及登入 Google Cloud 控制台

  1. 點選「Start Lab」按鈕。如果實驗室會產生費用,畫面上會出現選擇付款方式的對話方塊。左側的「Lab Details」窗格會顯示下列項目:

    • 「Open Google Cloud console」按鈕
    • 剩餘時間
    • 必須在這個研究室中使用的臨時憑證
    • 完成這個實驗室所需的其他資訊 (如有)
  2. 點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」

    接著,實驗室會啟動相關資源,並開啟另一個分頁,顯示「登入」頁面。

    提示:您可以在不同的視窗中並排開啟分頁。

    注意:如果頁面中顯示「選擇帳戶」對話方塊,請點選「使用其他帳戶」
  3. 如有必要,請將下方的 Username 貼到「登入」對話方塊。

    {{{user_0.username | "Username"}}}

    您也可以在「Lab Details」窗格找到 Username。

  4. 點選「下一步」

  5. 複製下方的 Password,並貼到「歡迎使用」對話方塊。

    {{{user_0.password | "Password"}}}

    您也可以在「Lab Details」窗格找到 Password。

  6. 點選「下一步」

    重要事項:請務必使用實驗室提供的憑證,而非自己的 Google Cloud 帳戶憑證。 注意:如果使用自己的 Google Cloud 帳戶來進行這個實驗室,可能會產生額外費用。
  7. 按過後續的所有頁面:

    • 接受條款及細則。
    • 由於這是臨時帳戶,請勿新增救援選項或雙重驗證機制。
    • 請勿申請免費試用。

Google Cloud 控制台稍後會在這個分頁開啟。

注意:如要使用 Google Cloud 產品和服務,請點選「導覽選單」,或在「搜尋」欄位輸入服務或產品名稱。「導覽選單」圖示和搜尋欄位

啟用 Dataplex API 和 Data Catalog API

  1. 在 Google Cloud 控制台頂端的搜尋列中,輸入 Cloud Dataplex API

  2. 點選「Marketplace」下方的「Cloud Dataplex API」搜尋結果。

  3. 如果 API 尚未啟用,請點選「啟用」

  4. 重複步驟 1 至 3 來啟用 Google Cloud Data Catalog API

工作 1:建立湖泊、可用區和資產

在這項工作中,您將建立新的 Dataplex 湖泊來儲存消費者訂單資訊、在湖泊中新增收錄的可用區,然後附加預先建立的 BigQuery 資料集,做為可用區中的新資產。

建立湖泊

  1. 前往 Google Cloud 控制台的導覽選單 (導覽選單),點選「查看所有產品」。在「數據分析」下方,點選「Dataplex 通用目錄」

如果出現「歡迎使用新版 Dataplex 服務」提示訊息,請點選「關閉」

  1. 在「管理 lake」下方,點選「管理」

  2. 點選「建立」

  3. 輸入必要資訊來建立新的 lake:

屬性
顯示名稱 Orders Lake
ID 保留預設值。
區域

其他設定則維持預設值。

  1. 點選「建立」

lake 應該會在幾分鐘內建立。

如果 lake 的狀態顯示為「使用中」,即可前往下一個部分。

在 lake 新增可用區

  1. 在「管理」分頁中,點選湖泊名稱。

  2. 點選「新增可用區」

  3. 輸入必要資訊來建立新的可用區:

屬性
顯示名稱 Customer Curated Zone
ID 保留預設值。
類型 收錄的可用區
資料位置 區域性

其他設定則維持預設值。

舉例來說,「探索功能設定」下方的「啟用中繼資料探索功能」選項預設為啟用,可讓獲授權的使用者探索該可用區中的資料。

  1. 點選「建立」

可用區應該會在幾分鐘內建立。

如果可用區的狀態顯示為「使用中」,即可前往下一個部分。

將資產連結至可用區

  1. 在「可用區」分頁中,點選可用區名稱。

  2. 在「資產」分頁中,點選「新增資產」

  3. 點選「Add an asset」

  4. 輸入必要資訊來連結新資產:

屬性
類型 BigQuery 資料集
顯示名稱 Customer Details Dataset
ID 保留預設值。
資料集 .customers

其他設定則維持預設值。

  1. 點選「繼續」

  2. 在「探索功能設定」部分,選取「繼承」來繼承可用區層級的探索設定,然後點選「繼續」

  3. 點選「提交」

在 Dataplex 建立 lake、可用區和資產

工作 2:建立標記範本

請先建立一或多個標記範本,才能開始標記資料。標記範本可以是公開或私人範本。當您建立新的標記範本時,預設的建議選項為建立公開範本。如果使用者具有資料資產的必要查看權限,即可檢視與該資產相關聯的所有公開標記。這有助於簡化探索內容的搜尋作業,同時一併遵循基礎資料已採用的資料存取權控管機制。

在這項工作中,您將建立公開標記範本,將 BigQuery 資料表的資料欄標記為受保護狀態。如果使用者可以存取基礎 BigQuery 資料表的資料欄,使用公開標記範本時即可查看套用至資料欄的標記。

  1. 在左選單中的「管理中繼資料」下方,點選「Catalog」

  2. 點選「建立標記範本 (Deprecated)」

  3. 看見「確定要繼續嗎?」的提示訊息時,點選「繼續」

注意事項:切面類型將取代標記範本,不過目前仍能使用。您可以繼續執行後續步驟來建立標記範本。

這個實驗室已排定更新,不久後就會改為使用切面類型。
  1. 輸入必要資訊來定義標記範本:
屬性
範本顯示名稱 Protected Data Template
範本 ID 保留預設值。
位置
瀏覽權限 公開
  1. 按一下「新增欄位」,並輸入必要資訊,在範本中新增欄位:
屬性
欄位顯示名稱 Protected Data Flag
欄位 ID 保留預設值。
類型 列舉
  1. 在「列舉值」下方的「值 1」欄位中輸入 YES

  2. 點選「新增值」,並在「值 2」欄位中輸入 NO

  3. 按一下「完成」

  4. 點選「建立」

注意事項:標記範本應該會在幾分鐘內建立,接著進度檢查功能會傳回成功訊息。 建立標記範本

工作 3:將標記範本套用至 Dataplex 資產

建立標記範本後,即可使用範本,將標記套用到您有權存取的所需資料資產 (數量不限)。

在這項工作中,您會將先前建立的標記範本,套用到 BigQuery 資料表中要標記為受保護資料狀態的特定資料欄。

  1. 在左選單中,點選「探索」下方的「搜尋」

  2. 在「篩選器」下方的「系統」部分,勾選「Dataplex」核取方塊。

  3. 按一下 customer_details 資料表。

如果找不到 customer_details 資料表,請先稍等幾分鐘再重新整理頁面,讓系統更新 Dataplex 資產清單。

  1. 按一下「附加標記」

  2. 在「選擇要加上標記的內容」下方選單中,勾選下列資料欄的核取方塊:

    • zip
    • state
    • last_name
    • country
    • email
    • latitude
    • first_name
    • city
    • longitude
  3. 按一下「確定」

  4. 在「選擇標記範本」下方選單中,選取「Protected Data Template」

  5. 在「Protected Data Flag」下方選單中,選取「YES」

  6. 點選「儲存」

注意事項:標記範本應該會在幾分鐘內套用,接著進度檢查功能會傳回成功訊息。 將標記範本套用至 Dataplex 資產

工作 4:使用標記搜尋資產

標記資料資產後,即可使用 Dataplex 中的 Data Catalog,搜尋這些資產。

在這項工作中,您將搜尋已套用 Protected Data 標記範本的資產。

  1. 在左選單中,點選「探索」下方的「搜尋」

  2. 在「篩選器」下方的「標記」部分,勾選「Protected Data Template」核取方塊。

  3. 按一下 customer_details 資料表。

  4. 點選「結構定義與資料欄標記」分頁標籤,查看指定資料欄的 Protected Data 標記。

恭喜!

您已透過 Dataplex 中的 Data Catalog 建立標記範本、將範本套用至 Dataplex 資產,並依據標記搜尋資產。

Google Cloud 教育訓練與認證

協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。

使用手冊上次更新日期:2025 年 5 月 23 日

實驗室上次測試日期:2025 年 5 月 23 日

Copyright 2025 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

请使用无痕模式或无痕式浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。