实验设置说明和要求
保护您的账号和进度。请务必在无痕浏览器窗口中,使用实验凭证运行此实验。

在 Cloud Data Fusion 管道中遮蓋機密資料

实验 1 小时 30 分钟 universal_currency_alt 5 积分 show_chart 高级
info 此实验可能会提供 AI 工具来支持您学习。
此内容尚未针对移动设备进行优化。
为获得最佳体验,请在桌面设备上访问通过电子邮件发送的链接。

GSP811

Google Cloud 自修研究室標誌

總覽

本實驗室將說明如何使用 Cloud Fusion 的 Sensitive Data Protection 外掛程式,遮蓋敏感資料。

假設您在以下情境中,需要遮蓋一些敏感的客戶資訊。

情境:對於每個經手的客服案件,支援團隊都在支援單中記錄了詳細資料,且這些資訊全都會匯入 CSV 檔案。支援技術人員不應記錄任何敏感的客戶資訊,但有時會不小心這麼做。您發現 CSV 檔案中出現部分客戶的電話號碼。

您想檢查 CSV 檔案並隱藏所有電話號碼,於是使用 Sensitive Data Protection 外掛程式,建立 Cloud Data Fusion 管道來遮蓋敏感的客戶資料。

您將建立管道,用於下列作業:

  • 以 # 字元遮蓋客戶電話號碼和電子郵件地址。
  • 將遮蓋好的敏感資料,與非敏感資料一起儲存至 Cloud Storage。

目標

本實驗室將說明如何執行下列操作:

  • 將 Cloud Data Fusion 連結至 Cloud Storage 來源。
  • 部署 Sensitive Data Protection 外掛程式。
  • 建立自訂 Sensitive Data Protection 範本。
  • 使用遮蓋轉換外掛程式,遮蓋敏感的客戶資料。
  • 將輸出資料寫入 Cloud Storage。

設定和需求

每個實驗室都會提供新的 Google Cloud 專案和一組資源,讓您在時限內免費使用。

  1. 請以無痕視窗登入 Google Skills。

  2. 請記下實驗室時間限制 (例如 02:00:00),務必在時限內完成作業。
    研究室不提供暫停功能。如有需要,您可以重新開始,但原先的進度恕無法保留。

  3. 準備就緒之後,請點選「Start Lab」

    注意事項:點選「Start Lab」之後,研究室需要 15 至 20 分鐘來佈建必要資源,並建立 Data Fusion 執行個體。 在此期間,不妨詳閱下方步驟,瞭解研究室的目標。

    執行個體建立完畢之後,左側面板會顯示研究室憑證 (使用者名稱密碼),此時即可繼續登入控制台。
  4. 請記下研究室憑證 (使用者名稱密碼),登入 Google Cloud 控制台時會用到。

  5. 點選「Open Google console」

  6. 點選「Use another account」,然後複製這個研究室的憑證,並貼到提示中。
    如果使用其他憑證,系統會顯示錯誤或向您收取費用

  7. 接受條款,然後略過資源復原頁面。

注意事項:請等到已完成研究室工作或想重新開始時,再點選「End Lab」。這麼做會清除現有工作並移除專案。

登入 Google Cloud 控制台

  1. 在用來進行本實驗室活動的瀏覽器分頁或視窗,複製「Connection Details」面板中的使用者名稱,然後點選「Open Google Console」按鈕。
注意:如果系統要求您選擇帳戶,請點選「使用其他帳戶」
  1. 按照系統提示,依序貼上使用者名稱密碼
  2. 點選「Next」
  3. 接受條款及細則。

這個臨時帳戶只在實驗室期間有效,使用時務必遵守下列規定:

  • 請勿新增救援選項
  • 請勿申請免費試用
  1. 開啟主控台後,點選畫面左上方的「導覽選單」圖示 「導覽選單」圖示,即可查看服務清單。

導覽選單

啟用 Cloud Shell

Cloud Shell 是含有多項開發工具的虛擬機器,提供永久的 5 GB 主目錄,並在 Google Cloud 中運作。Cloud Shell 可讓您透過指令列存取 Google Cloud 資源。gcloud 是 Google Cloud 的指令列工具,已預先安裝於 Cloud Shell,並支援 Tab 鍵完成功能。

  1. 在控制台的右上方,點按「啟用 Cloud Shell」按鈕 「啟用 Cloud Shell」圖示

  2. 點按「繼續」
    請稍候片刻,等待系統完成佈建作業並連線至環境。連線建立後,即代表您已通過驗證,且專案已設為「PROJECT_ID」

指令範例

  • 列出目前使用的帳戶名稱:
gcloud auth list

輸出內容

Credentialed accounts: - <myaccount>@<mydomain>.com (active)

輸出內容範例

Credentialed accounts: - google1623327_student@qwiklabs.net
  • 列出專案 ID:
gcloud config list project

輸出內容

[core] project = <project_ID>

輸出內容範例

[core] project = qwiklabs-gcp-44776a13dea667a6 注意:如需 gcloud 的完整說明,請參閱 gcloud CLI 總覽指南

檢查專案權限

開始使用 Google Cloud 前,請務必確保專案在 Identity and Access Management (IAM) 中具備正確的權限。

  1. 前往 Google Cloud 控制台的「導覽選單」「導覽選單」圖示,依序點選「IAM 與管理」>「身分與存取權管理」

  2. 確認具有預設的運算服務帳戶 {project-number}-compute@developer.gserviceaccount.com,且已指派 editor 角色。帳戶前置字串為專案編號,如需查看,請前往「導覽選單」>「Cloud 總覽」

預設的運算服務帳戶

如果帳戶未顯示在 IAM 中,或沒有 editor 角色,請依照下列步驟指派必要角色。

  1. 前往 Google Cloud 控制台,依序點選「導覽選單」>「Cloud 總覽」

  2. 從「專案資訊」資訊卡複製「專案編號」

  3. 從「導覽選單」依序點選「IAM 與管理」>「身分與存取權管理」

  4. 點選「身分與存取權管理」頁面頂端的「新增」

  5. 在「新增主體」輸入:

{project-number}-compute@developer.gserviceaccount.com

{project-number} 換成您的專案編號。

  1. 從「請選擇角色」選單依序選取「基本」或「專案」>「編輯者」

  2. 點選「儲存」

工作 1:設定 Cloud Storage bucket

您將在專案中建立 Cloud Storage bucket,供管道儲存輸出資料。

  • 在 Cloud Shell 執行以下指令,建立新的 bucket:

    export BUCKET=$GOOGLE_CLOUD_PROJECT gcloud storage buckets create gs://$BUCKET

新建立的 bucket 名稱會與專案 ID 相同。

點選「Check my progress」,確認目標已達成。 設定 Cloud Storage bucket

工作 2:新增 Cloud Data Fusion 執行個體的必要權限

  1. 前往 Google Cloud 控制台,在標題列的「搜尋」欄位輸入「Data Fusion」,然後點選搜尋結果中的「Data Fusion」。您應會看到已設定完成,且可供使用的 Cloud Data Fusion 執行個體。
注意:建立執行個體約需 20 分鐘,請耐心等候。

接著請按照下列步驟,授予權限給與執行個體相關聯的服務帳戶。

  1. 前往 Google Cloud 控制台,依序點選「IAM 與管理」>「身分與存取權管理」

  2. 確認 Compute Engine 預設服務帳戶 {project-number}-compute@developer.gserviceaccount.com 確實存在,並將這個服務帳戶複製到剪貼簿。

  3. 在「IAM 權限」頁面,按一下「+ 授予存取權」

  4. 在「新增主體」欄位貼上服務帳戶。

  5. 按一下「選取角色」欄位,開始輸入並選取「Cloud Data Fusion API 服務代理」

  6. 按一下「儲存」

點選「Check my progress」,確認目標已達成。 將 Cloud Data Fusion API 服務代理角色,新增至服務帳戶

授予服務帳戶使用者權限

  1. 前往控制台,依序點選「導覽選單」圖示 >「IAM 與管理」>「身分與存取權管理」

  2. 勾選「包含 Google 提供的角色授予項目」核取方塊。

  3. 向下捲動清單,找到 Google 代管的 Cloud Data Fusion 服務帳戶 (格式為 service-{project-number}@gcp-sa-datafusion.iam.gserviceaccount.com),然後將該帳戶的名稱複製到剪貼簿。

Google 代管的 Cloud Data Fusion 服務帳戶清單

  1. 接著,依序點選「IAM 與管理」>「服務帳戶」

  2. 點選預設的 Compute Engine 帳戶 (格式為 {project-number}-compute@developer.gserviceaccount.com),然後選取頂端導覽面板中的「具備存取權的主體」分頁標籤。

  3. 點選「授予存取權」按鈕。

  4. 在「新增主體」欄位,貼上先前複製的服務帳戶名稱。

  5. 在「角色」下拉式選單,選取「服務帳戶使用者」

  6. 點選「儲存」

工作 3:取得 Sensitive Data Protection 權限

  1. 前往 Cloud 控制台,依序點選「導覽選單」>「身分與存取權管理」

  2. 在「權限」資料表的右上角,找出並點選「Include Google-provided role grants」核取方塊。

已選取「Include Google-provided role grants」核取方塊

  1. 在「權限」資料表的「主體」欄,找出符合下列格式的服務帳戶:service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com

服務帳戶主體篩選器

  1. 點選服務帳戶右側的「編輯」按鈕。

  2. 按一下「新增其他角色」

  3. 按一下隨即顯示的下拉式選單。

  4. 使用搜尋列搜尋並選取「DLP 管理員」

新增 DLP 管理員角色

  1. 按一下「儲存」

  2. 確認「角色」欄中顯示「DLP 管理員」

已新增 DLP 管理員角色

點選「Check my progress」,確認目標已達成。 取得 Sensitive Data Protection 權限

工作 4:前往 Cloud Data Fusion UI

  1. 前往「Data Fusion」,依序點選「執行個體」,以及 Data Fusion 執行個體旁的「查看執行個體」連結。如有需要,請使用實驗室憑證登入。如果出現服務導覽的提示,請點選「不用了,謝謝」。現在應會進入 Cloud Data Fusion UI。

  2. 在 Cloud Data Fusion UI 中,按一下左上角的「導覽選單」,然後前往「Studio」頁面。 接下來將建立管道。

工作 5:建立管道

接下來建構的管道會執行下列作業: * 使用 Cloud Storage 來源外掛程式讀取輸入資料。 * 從中樞部署 Sensitive Data Protection 外掛程式,並套用遮蓋轉換外掛程式。 * 使用 Cloud Storage 接收器外掛程式寫入輸出資料。

  1. 在「Studio」頁面的左側面板中,按一下「來源」選單下方的「Google Cloud Storage (GCS)」外掛程式。

已選取「來源」選單中的 GCS 外掛程式

  1. 將游標懸停在顯示的「GCS」節點上,然後點選「屬性」

  2. 在「參照名稱」部分,輸入參照名稱。

  3. 本實驗室使用公開 Cloud Storage bucket 提供的輸入資料集 SampleRecords.csv。在「路徑」下方,輸入 gs://cloud-training/OCBL167/SampleRecords.csv

  4. 在「格式」部分,選取「CSV」

  5. 在「輸出內容的結構定義」的「欄位名稱」下方,點選「+」按鈕,為各資料類型輸入下列內容。請移除所有現有的資料類型 (如有)。

    • Date
    • Bank
    • State
    • Zip
    • Notes
  6. 確認所有資料類型都是「字串」。如要變更類型,請按一下「類型」,然後從下拉式選單中選取「字串」

  7. 勾選各資料類型的核取方塊。這樣可確保管道遇到空值時不會執行失敗。

GCS 屬性設定

  1. 點選「驗證」,確保沒有錯誤。

  2. 點選對話方塊右上角的「X」按鈕。

工作 6:遮蓋敏感資料

遮蓋轉換外掛程式會找出輸入資料串流中的敏感記錄,並對這些記錄套用您定義的轉換。如果資料記錄符合所選的預設 Sensitive Data Protection 篩選器,或是您定義的自訂範本,即視為敏感資料。

在本實驗室中,您要遮蓋團隊中部分支援技術人員不小心記下的客戶電話號碼。他們在支援單的「附註」部分輸入了敏感資訊,這些資訊會顯示在 CSV 檔案的「Notes」欄。您將建立自訂的 Sensitive Data Protection 檢查範本,然後在遮蓋轉換外掛程式的屬性選單中,提供範本 ID。

工作 7:部署 Sensitive Data Protection 外掛程式

  1. 在 Cloud Data Fusion UI 中,按一下右上角的「中樞」

  2. 點選「資料遺失防護」外掛程式。

  3. 按一下「部署」

  4. 按一下「完成」。

  5. 在「資料遺失防護 | 部署」對話方塊,點選右上角的「X」按鈕。

  6. 點選「X」按鈕關閉中樞。

工作 8:建立自訂範本

  1. 前往 Google Cloud 控制台,在標題列的「搜尋」欄位輸入「安全性」,然後點選搜尋結果中的「安全性」。選取「Sensitive Data Protection」

  2. 依序點選「設定」分頁標籤和「建立範本」

  3. 在「定義範本」的「範本 ID」欄位,輸入範本 ID。本教學課程稍後需用到這個 ID。

  4. 按一下「繼續」

  5. 在「設定偵測作業」部分,點選「管理 infoType」

  6. 在「內建」分頁,使用篩選器搜尋 phone number

內建電話號碼篩選器

  1. 選取「PHONE_NUMBER」

  2. 按一下「完成」

  3. 點選「建立」

點選「Check my progress」,確認目標已達成。 建立自訂範本

工作 9:套用遮蓋轉換

  1. 返回 Cloud Data Fusion UI 的「Studio」頁面,點選並展開「轉換」選單。

  2. 點選「Google DLP Redact」轉換外掛程式。

選取遮蓋轉換

  1. 將連結箭頭從「GCS」節點拖曳至「Google DLP Redact」節點。

GCS 節點已連結至 Redact 節點

  1. 將游標懸停在「Google DLP Redact」節點上,然後點選「屬性」
  • 將「Use custom template」設為「是」
  • 在「範本 ID」部分,輸入您建立的自訂範本 ID。
  • 在「Matching」部分,對「Notes」內的「自訂範本」套用「Masking」
注意:除了遮蓋功能,Sensitive Data Protection 外掛程式還提供其他 Sensitive Data Protection 轉換。如要瞭解詳情,請參閱遮蓋外掛程式屬性選單中的「說明文件」分頁。
  1. 在「遮蓋字元」部分,輸入 #

遮蓋屬性設定

  1. 點選「驗證」,確保沒有錯誤。

  2. 點選對話方塊右上角的「X」按鈕。

工作 10:儲存輸出資料

將管道輸出結果儲存至 Cloud Storage 檔案。

  1. 在 Cloud Data Fusion UI 的「Studio」頁面,點選並展開「接收器」選單。

  2. 按一下「GCS」

  3. 將連結箭頭從「Google DLP Redact」節點,拖曳至「GCS2」節點。

Redact 節點已連結至 GCS2

  1. 將游標懸停在「GCS2」節點上,然後按一下「屬性」
  • 在「參照名稱」部分,輸入參照名稱。
  • 在「路徑」部分,輸入本實驗室開頭建立的 Cloud Storage bucket 路徑。
  • 在「格式」部分,選取「CSV」

GCS 接收器屬性設定

  1. 點選「驗證」,確保沒有錯誤。

  2. 點選對話方塊右上角的「X」按鈕。

工作 11:在預覽模式中執行管道

接下來,要在部署前先以預覽模式執行管道。

  1. 依序點選「預覽」>「執行」管道預覽執行設定

「執行」按鈕會顯示管道狀態,一開始是「啟動中」,接著變成「停止」,再轉為「執行」

  1. 預覽執行作業完成後,在「Google DLP Redact」節點按一下「預覽資料」,即可並排比較輸入和輸出資料。確認電話號碼已使用 # 字元遮蓋。

遮蓋屬性輸出結果 3. 點選「X」按鈕,關閉「預覽資料」視窗。

注意:如未在「Notes」欄看到電話號碼,請將游標懸停在項目上,確認結果。

工作 12:遮蓋其他資料類型

查看預覽執行作業結果時,您發現「Notes」欄出現其他敏感資訊:電子郵件地址。請返回並編輯 Sensitive Data Protection 檢查範本,一併遮蓋電子郵件地址。

  1. 依序前往「安全性」>「Sensitive Data Protection」

  2. 在「設定」分頁選取所需範本。

  3. 按一下「編輯」

  4. 按一下「管理 infoType」

  5. 在「內建」分頁,使用篩選器搜尋 phone number OR email address

內建電話號碼或電子郵件地址篩選器

  1. 選取所有項目,然後按一下「完成」

  2. 按一下「儲存」

  3. 在彈出式視窗中,點選「確定儲存」

  4. 再次以預覽模式執行管道。Cloud Data Fusion 會自動使用更新後的 Sensitive Data Protection 範本。

  5. 確認電話號碼和電子郵件地址都已使用 # 字元遮蓋。

管道預覽輸出結果

注意:如未在「Notes」欄看到電話號碼和電子郵件地址,請將游標懸停在項目上,確認結果。

點選「Check my progress」,確認目標已達成。 遮蓋其他資料類型

工作 13:部署及執行管道

  1. 確認未勾選「預覽」模式。

  2. 按一下「儲存」系統會提示您為管道命名,請設定名稱並點選「儲存」

為管道命名的文字欄位

  1. 按一下「部署」

  2. 部署完畢後,按一下「執行」。管道執行作業會在幾分鐘內完成。等待期間,管道的「狀態」會從「佈建中」,依序變更為「啟動中」、「執行中」和「已成功」

注意:如果管道執行失敗,請重新執行

點選「Check my progress」,確認目標已達成。 部署及執行管道

工作 14:查看結果

  1. 前往 Cloud 控制台的「Cloud Storage」

  2. 在「Storage browser」部分,前往您在接收器 Cloud Storage 外掛程式屬性中,所指定的 Cloud Storage bucket。

  3. 在「已通過驗證的網址」部分,複製連結並貼到新的瀏覽器分頁,即可下載含有結果的 CSV 檔案。確認電話號碼和電子郵件地址都已使用 # 字元遮蓋。

Google Cloud Storage 物件詳細資料設定

恭喜!

在本實驗室中,您學到如何使用 Sensitive Data Protection,遮蓋流經 Data Fusion 管道的特定資料。這項功能可協助您在分享資料給特定對象前,移除/遮蓋資料中嵌入的 PII 資訊。

如要進一步瞭解如何建立 Sensitive Data Protection 範本,請參閱說明文件。

使用手冊上次更新日期:2025 年 12 月 9 日

實驗室上次測試日期:2025 年 12 月 9 日

Copyright 2026 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

使用无痕模式或无痕浏览器窗口是运行此实验的最佳方式。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。