实验设置说明和要求
保护您的账号和进度。请务必在无痕浏览器窗口中,使用实验凭据运行此实验。

Data Catalog:Qwik Start

实验 30 分钟 universal_currency_alt 1 积分 show_chart 入门级
info 此实验可能会提供 AI 工具来支持您学习。
此内容尚未针对移动设备进行优化。
为获得最佳体验,请在桌面设备上访问通过电子邮件发送的链接。

Data Catalog 已淘汰,並將於 2026 年 1 月 30 日停止運作。您仍可選擇完成本實驗室。

如要瞭解如何將 Data Catalog 使用者、工作負載和內容轉移至 Dataplex Universal Catalog,請參閱說明文件「從 Data Catalog 轉移至 Dataplex Catalog」。

GSP729

Google Cloud 自學實驗室標誌

總覽

Data CatalogDataplex 中可擴充的全代管中繼資料管理服務,

這套分類系統功能強大且彈性佳,其資料探索搜尋介面簡單易用,可擷取技術和業務中繼資料,並運用 Cloud Data Loss Prevention (DLP) 和 Cloud Identity and Access Management (IAM) 的整合功能,奠定穩固的安全性與法規遵循基礎。

BigQuery 是一種企業資料倉儲,能夠利用 Google 基礎架構的強大處理能力,以超高效率執行 SQL 查詢。

只要將您的資料移至 BigQuery,其他相關的繁雜工作可以放心交給 Google。您可以根據業務需求控管專案與資料的存取權,例如授予他人檢視或查詢資料的權限。

使用 Data Catalog

您可透過兩種主要方式和 Cloud Data Catalog 互動:

  • 搜尋您可以存取的資料資產。
  • 以中繼資料標記資產。

Data Catalog 應用實例

假設您是公司的資料工程師,工作是確保所有資料集都能輕鬆找到,並供資料科學家或業務分析師等同事使用。當新資料集傳入時,您會加上重要資訊的註解,例如是否包含 PII 資料、資料集擁有者,以及包含的資料列數量等。

您可以在資料集和資料表新增「標記」,為這類資訊加上註解。Data Catalog 可讓您建立標記範本,定義要標記的屬性類型,方便您輕鬆存取、對應及找出資料集和資料表中的相關資訊。

課程內容

本實驗室的內容包括:

  • 啟用 Data Catalog API,即可在 Google Cloud 專案使用這項服務。
  • 使用 BigQuery 建立資料集。
  • 將公開的紐約計程車資料表複製到資料集。
  • 建立 Data Catalog 標記範本。
  • 將新建立的標記加入新建立的資料表。

事前準備

注意:開始本實驗室前,請登出個人或企業的 Gmail 帳戶,或在無痕模式執行本實驗室

這是為了避免實驗室運作期間發生登入錯亂問題。

設定和需求

瞭解以下事項後,再點選「Start Lab」按鈕

請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。

您將在真正的雲端環境完成實作實驗室活動,而不是模擬或示範環境。為此,我們會提供新的暫時憑證,供您在實驗室活動期間登入及存取 Google Cloud。

為了順利完成這個實驗室,請先確認:

  • 可以使用標準的網際網路瀏覽器 (Chrome 瀏覽器為佳)。
注意事項:請使用無痕模式 (建議選項) 或私密瀏覽視窗執行此實驗室,這可以防止個人帳戶和學員帳戶之間的衝突,避免個人帳戶產生額外費用。
  • 是時候完成實驗室活動了!別忘了,活動一旦開始將無法暫停。
注意事項:務必使用實驗室專用的學員帳戶。如果使用其他 Google Cloud 帳戶,可能會產生額外費用。

如何開始研究室及登入 Google Cloud 控制台

  1. 點選「Start Lab」按鈕。如果實驗室會產生費用,畫面上會出現選擇付款方式的對話方塊。左側的「Lab Details」窗格會顯示下列項目:

    • 「Open Google Cloud console」按鈕
    • 剩餘時間
    • 必須在這個研究室中使用的臨時憑證
    • 完成這個實驗室所需的其他資訊 (如有)
  2. 點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」

    接著,實驗室會啟動相關資源,並開啟另一個分頁,顯示「登入」頁面。

    提示:您可以在不同的視窗中並排開啟分頁。

    注意:如果頁面中顯示「選擇帳戶」對話方塊,請點選「使用其他帳戶」
  3. 如有必要,請將下方的 Username 貼到「登入」對話方塊。

    {{{user_0.username | "Username"}}}

    您也可以在「Lab Details」窗格找到 Username。

  4. 點選「下一步」

  5. 複製下方的 Password,並貼到「歡迎使用」對話方塊。

    {{{user_0.password | "Password"}}}

    您也可以在「Lab Details」窗格找到 Password。

  6. 點選「下一步」

    重要事項:請務必使用實驗室提供的憑證,而非自己的 Google Cloud 帳戶憑證。 注意:如果使用自己的 Google Cloud 帳戶來進行這個實驗室,可能會產生額外費用。
  7. 按過後續的所有頁面:

    • 接受條款及細則。
    • 由於這是臨時帳戶,請勿新增救援選項或雙重驗證機制。
    • 請勿申請免費試用。

Google Cloud 控制台稍後會在這個分頁開啟。

注意:如要使用 Google Cloud 產品和服務,請點選「導覽選單」,或在「搜尋」欄位輸入服務或產品名稱。「導覽選單」圖示和搜尋欄位

啟動 Cloud Shell

Cloud Shell 是搭載多項開發工具的虛擬機器,提供永久的 5 GB 主目錄,而且在 Google Cloud 中運作。Cloud Shell 提供指令列存取權,方便您使用 Google Cloud 資源。

  1. 點按 Google Cloud 控制台頂端的「啟用 Cloud Shell」圖示 「啟動 Cloud Shell」圖示

  2. 系統顯示視窗時,請按照下列步驟操作:

    • 繼續操作 Cloud Shell 視窗。
    • 授權 Cloud Shell 使用您的憑證發出 Google Cloud API 呼叫。

連線建立完成即代表已通過驗證,而且專案已設為您的 Project_ID。輸出內容中有一行文字,宣告本工作階段的 Project_ID

Your Cloud Platform project in this session is set to {{{project_0.project_id | "PROJECT_ID"}}}

gcloud 是 Google Cloud 的指令列工具,已預先安裝於 Cloud Shell,並支援 Tab 鍵自動完成功能。

  1. (選用) 您可以執行下列指令來列出使用中的帳戶:
gcloud auth list
  1. 點按「授權」

輸出內容:

ACTIVE: * ACCOUNT: {{{user_0.username | "ACCOUNT"}}} To set the active account, run: $ gcloud config set account `ACCOUNT`
  1. (選用) 您可以使用下列指令來列出專案 ID:
gcloud config list project

輸出內容:

[core] project = {{{project_0.project_id | "PROJECT_ID"}}} 注意:如需 gcloud 的完整說明,請前往 Google Cloud 參閱 gcloud CLI 總覽指南

工作 1:啟用 Data Catalog API

  1. 在導覽選單,依序選取「API 和服務」>「程式庫」

  2. 在搜尋列輸入 Data Catalog,然後選取「Google Cloud Data Catalog API」

  3. 點按「啟用」

排解啟用 API 時發生的問題

如果啟用 Data Catalog API 後遇到下列錯誤:

「無法啟用 API」錯誤訊息

  1. 點按「關閉」
  2. 重新整理瀏覽器分頁。
  3. 再次點按「啟用」

Data Catalog API 應會順利啟用:

顯示 Data Catalog API 總覽的 Google Cloud Data Catalog 視窗

開啟 BigQuery 控制台

  1. 在 Google Cloud 控制台中,依序選取「導覽選單」>「BigQuery」

接著,畫面中會顯示「歡迎使用 Cloud 控制台中的 BigQuery」訊息方塊,當中會列出快速入門導覽課程指南的連結和版本資訊。

  1. 點選「完成」

BigQuery 控制台會隨即開啟。

工作 2:建立資料集

  1. 在 BigQuery 左側導覽窗格,點選專案 ID 旁的「查看動作」,然後點按「建立資料集」

「查看動作」導覽選單,其中專案子選單醒目顯示「建立資料集」選項。

  1. 在「建立資料集」對話方塊中:
  • 在「資料集 ID」部分輸入 demo_dataset

  • 在「資料位置」部分,選取「US (multiple regions in United States)」。

「建立資料集」頁面,其中「專案 ID」、「資料集 ID」和「資料位置」欄位已填妥。

  1. 接著點選「建立資料集」
注意:使用 Cloud Console 建立資料集時,您無法新增說明或標籤;建立完畢後則可以新增。

點選「Check my progress」,確認目標已達成。 建立資料集

工作 3:將公開的紐約計程車資料表複製到資料集。

  1. 在左側面板,依序點選「+ 新增資料」>「公開資料集」

  2. 在搜尋列輸入「NYC TLC Trips」,然後點按顯示的結果:

搜尋結果,其中「Filter by」選單旁醒目顯示了「NYC TLC Trips」方塊。

在本實驗室,您將使用這個資料集中的資料表,其中包含 2018 年紐約市黃色計程車的載客資料。

  1. 準備好繼續時,點選側邊面板外的部分即可關閉。

  2. 在「Cloud Shell」面板執行下列指令,複製 tlc_yellow_trips_2018 資料表,接著點選「授權」

bq cp bigquery-public-data:new_york_taxi_trips.tlc_yellow_trips_2018 $(gcloud config get project):demo_dataset.trips

前一個指令使用 bq command line tool,將公開資料表複製到您的專案,並整理到先前建立的 demo_dataset

  1. 重新整理 BigQuery 瀏覽器頁面。

  2. 確認「trips」資料表已列在 demo_dataset

列出的釘選專案,其中「trips」資料表會列為 demo_dataset 中的檔案。

您將在下一節為資料表新增 Data Catalog 標記。

點選「Check my progress」,確認目標已達成。 將公開的紐約計程車資料表複製到資料集

工作 4:建立 Data Catalog 標記範本

透過 Data Catalog UI 建立標記範本。

  1. 前往 Google Cloud 控制台的「導覽選單」 (導覽選單),點選「查看所有產品」。在「數據分析」下方,點選「Dataplex Universal Catalog」

  2. 在左選單中的「管理中繼資料」下方,點選「Catalog」

  3. 點選「建立標記範本 (已淘汰)」

  4. 系統提示「確定要繼續嗎?」時,點選「繼續」

注意事項:切面類型將取代標記範本,不過目前仍能使用。您可以繼續執行後續步驟來建立標記範本。
  1. 填寫範本表單,定義「Demo Tag Template」。
  • 範本顯示名稱:Demo Tag Template
  • 範本 ID:demo_tag_template
  • 位置:

接著建立四個標記屬性 (也稱為標記「欄位」)。

  1. 點選「新增欄位」

使用下列值建立四個屬性。請注意,「來源」屬性會定義必要的標記屬性。您可以使用小寫英文字母和底線來定義屬性名稱:

  • 欄位顯示名稱:資料資產來源
  • 欄位 ID:source_of_data_asset
  • 將此欄位設為必填:已勾選
  • 類型:字串
  1. 按一下「完成」

  2. 接著點選「新增欄位」,並輸入下列內容:

  • 欄位顯示名稱:資料資產的資料列數量
  • 欄位 ID:number_of_rows_in_data_asset
  • 將此欄位設為必填:未勾選
  • 類型:雙精度值
  1. 按一下「完成」

  2. 接著點選「新增欄位」,並輸入下列內容:

  • 欄位顯示名稱:具有 PII
  • 欄位 ID:has_pii
  • 將此欄位設為必填:未勾選
  • 類型:布林值
  1. 按一下「完成」

  2. 接著點選「新增欄位」,並輸入下列內容:

  • 欄位顯示名稱:PII 類型
  • 欄位 ID:pii_type
  • 將此欄位設為必填:未勾選
  • 類型:列舉
  1. 為這個屬性新增 3 個值:
  • 電子郵件
  • 身分證字號
  1. 按一下「完成」

填妥的標記範本表單應列出四個標記屬性:

已填妥的標記範本表單,以及瀏覽權限選項、建立和取消按鈕。

  1. 點選「建立」。

Data Catalog 的「標記範本」頁面,會顯示範本詳細資料和屬性:

已填妥的資料目錄,列出範本詳細資料、欄位、顯示名稱和類型。

點選「Check my progress」,確認目標已達成。 建立標記範本

工作 5:將新建立的標記加入資料表

  1. 如要將標記附加至資料集中的資料表,請點選左上角的「Data Catalog」圖示。

  2. 在左側窗格選取「搜尋」,並在搜尋框輸入 demo_dataset

  3. 按一下「搜尋」

Data Catalog 頁面,搜尋列中輸入了「demo_dataset」字詞。

搜尋結果會顯示 demo_dataset,以及您複製到資料集的 trips 資料表。

  1. 點選「trips」名稱開啟資料表:

demo_dataset 及其規格,以及醒目顯示的 trips 資料表。

「項目詳細資料」頁面隨即開啟。

  1. 按一下「附加標記」

「項目詳細資料」頁面醒目顯示「附加標記」按鈕。

  1. 在「附加標記」對話方塊的「選擇要加上標記的內容」下方,選取 trips 資料表,然後點選「確定」

  2. 在標記範本選取「Demo Tag Template」

  3. 接著,為每個標記屬性插入或選取下列值:

  • source_of_data_asset:tlc_yellow_trips_2018
  • pii_type:無

「附加標記」頁面的「Demo Tag Template」中,資料資產來源和 PII 類型已選取並填妥。

  1. 點選「儲存」

  2. 點選 Demo Tag Template,即可在「項目詳細資料」頁面查看列出的標記屬性。

「項目詳細資料」頁面,其中包含「Demo Tag Template」的顯示名稱、資料資產來源和 PII 類型。

點選「Check my progress」,確認目標已達成。 將標記附加至資料表

恭喜!

太好了!您已學會如何使用 Data Catalog 成功建立標記,並附加至資料表。

後續步驟/瞭解詳情

Google Cloud 教育訓練與認證

協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。

使用手冊上次更新日期:2025 年 5 月 27 日

實驗室上次測試日期:2025 年 5 月 27 日

Copyright 2025 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

请使用无痕模式或无痕式浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。