ラボの設定手順と要件
アカウントと進行状況を保護します。このラボを実行するには、常にシークレット ブラウジング ウィンドウとラボの認証情報を使用してください。

Data Catalog: Qwik Start

ラボ 30分 universal_currency_alt クレジット: 1 show_chart 入門
info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。
このコンテンツはまだモバイル デバイス向けに最適化されていません。
快適にご利用いただくには、メールで送信されたリンクを使用して、デスクトップ パソコンでアクセスしてください。

Data Catalog は非推奨となり、2026 年 1 月 30 日に廃止されます。このラボは、引き続き必要に応じて実行することができます。

Data Catalog のユーザー、ワークロード、コンテンツを Dataplex Universal Catalog に移行する手順については、Data Catalog から Dataplex Universal Catalog に移行するをご覧ください。

GSP729

Google Cloud セルフペース ラボのロゴ

概要

Data Catalog は、Dataplex の一部として提供されるスケーラブルなフルマネージド型メタデータ管理サービスです。

データ検出のためのシンプルで使いやすい検索インターフェースと、テクニカル メタデータおよびビジネス メタデータの両方を取得できる柔軟で強力なカタログ化システムを提供しています。また、Cloud Data Loss Prevention(DLP)および Cloud Identity and Access Management(IAM)とのインテグレーションにより、セキュリティとコンプライアンスの強固な基盤を備えています。

BigQuery は、Google のインフラストラクチャの処理能力を利用して SQL クエリを高速で実行するエンタープライズ データ ウェアハウスです。

ユーザーがデータを BigQuery に読み込んだら、後の処理は Google 側で行われます。 他のユーザーにデータの表示やクエリを許可するなど、ビジネスニーズに基づいてプロジェクトとデータへのアクセスを制御できます。

Data Catalog の使用

Data Catalog では、主に 2 つの操作を行います。

  • アクセス可能なデータアセットを検索する。
  • メタデータでアセットにタグ付けする。

Data Catalog のユースケース

自分が自社のデータ エンジニアであると想像してみてください。データ サイエンティストやビジネス アナリストなど、同僚があらゆるデータセットを簡単に探索して使用できるようにすることが仕事です。新しいデータセットを入手したら、重要な情報でアノテーションを付けます。たとえば、個人情報(PII)データが含まれているかどうか、データセットの所有者は誰か、データセットに含まれている行の数はいくつかといった情報が含まれます。

このような情報をアノテーションとして付けるには、対象のデータセットとテーブルにタグを追加します。Data Catalog を使用すると、タグ テンプレートを作成して、タグ付けする属性の種類を定義できます。これにより、データセットとテーブルに簡単にアクセスしてマッピングし、関連情報を見つけ出すことができます。

学習内容

このラボでは、次の方法について学びます。

  • Data Catalog API を有効にして、このサービスを Google Cloud プロジェクト内で使用できるようにする。
  • BigQuery でデータセットを作成する。
  • New York Taxi 一般公開テーブルをデータセットにコピーする。
  • Data Catalog タグ テンプレートを作成する。
  • 新しく作成したテーブルに、新しく作成したタグを付ける。

前提条件

注: ラボを開始する前に個人または企業の Gmail アカウントからログアウトするか、このラボをシークレット モードで実行してください。

これにより、ラボの受講中にログインによる混乱を避けることができます。

設定と要件

[ラボを開始] ボタンをクリックする前に

こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。

このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

このラボを完了するためには、下記が必要です。

  • 標準的なインターネット ブラウザ(Chrome を推奨)
注: このラボの実行には、シークレット モード(推奨)またはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生しないようにすることができます。
  • ラボを完了するための時間(開始後は一時停止できません)
注: このラボでは、受講者アカウントのみを使用してください。別の Google Cloud アカウントを使用すると、そのアカウントに料金が発生する可能性があります。

ラボを開始して Google Cloud コンソールにログインする方法

  1. [ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるダイアログでお支払い方法を選択してください。 左側の [ラボの詳細] ペインには、以下が表示されます。

    • [Google Cloud コンソールを開く] ボタン
    • 残り時間
    • このラボで使用する必要がある一時的な認証情報
    • このラボを行うために必要なその他の情報(ある場合)
  2. [Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウで開く] を選択します)。

    ラボでリソースがスピンアップし、別のタブで [ログイン] ページが表示されます。

    ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。

    注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。
  3. 必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。

    {{{user_0.username | "Username"}}}

    [ラボの詳細] ペインでもユーザー名を確認できます。

  4. [次へ] をクリックします。

  5. 以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。

    {{{user_0.password | "Password"}}}

    [ラボの詳細] ペインでもパスワードを確認できます。

  6. [次へ] をクリックします。

    重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。 注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。
  7. その後次のように進みます。

    • 利用規約に同意してください。
    • 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
    • 無料トライアルには登録しないでください。

その後、このタブで Google Cloud コンソールが開きます。

注: Google Cloud のプロダクトやサービスにアクセスするには、ナビゲーション メニューをクリックするか、[検索] フィールドにサービス名またはプロダクト名を入力します。 ナビゲーション メニュー アイコンと検索フィールド

Cloud Shell をアクティブにする

Cloud Shell は、開発ツールと一緒に読み込まれる仮想マシンです。5 GB の永続ホーム ディレクトリが用意されており、Google Cloud で稼働します。Cloud Shell を使用すると、コマンドラインで Google Cloud リソースにアクセスできます。

  1. Google Cloud コンソールの上部にある「Cloud Shell をアクティブにする」アイコン 「Cloud Shell をアクティブにする」アイコン をクリックします。

  2. ウィンドウで次の操作を行います。

    • Cloud Shell 情報ウィンドウで操作を進めます。
    • Cloud Shell が認証情報を使用して Google Cloud API を呼び出すことを承認します。

接続した時点で認証が完了しており、プロジェクトに各自の Project_ID が設定されます。出力には、このセッションの PROJECT_ID を宣言する次の行が含まれています。

Your Cloud Platform project in this session is set to {{{project_0.project_id | "PROJECT_ID"}}}

gcloud は Google Cloud のコマンドライン ツールです。このツールは、Cloud Shell にプリインストールされており、タブ補完がサポートされています。

  1. (省略可)次のコマンドを使用すると、有効なアカウント名を一覧表示できます。
gcloud auth list
  1. [承認] をクリックします。

出力:

ACTIVE: * ACCOUNT: {{{user_0.username | "ACCOUNT"}}} To set the active account, run: $ gcloud config set account `ACCOUNT`
  1. (省略可)次のコマンドを使用すると、プロジェクト ID を一覧表示できます。
gcloud config list project

出力:

[core] project = {{{project_0.project_id | "PROJECT_ID"}}} 注: Google Cloud における gcloud ドキュメントの全文については、gcloud CLI の概要ガイドをご覧ください。

タスク 1. Data Catalog API を有効にする

  1. ナビゲーション メニューで [API とサービス] > [ライブラリ] を選択します。

  2. 検索バーに「Data Catalog」と入力し、[Google Cloud Data Catalog API] を選択します。

  3. 続いて [有効にする] をクリックします。

API の有効化に関するトラブルシューティング

Data Catalog API を有効にしようとして次のエラーが発生した場合:

API 有効化に失敗したエラー メッセージ

  1. [閉じる] をクリックします。
  2. ブラウザのタブを更新します。
  3. もう一度 [有効にする] をクリックします。

Data Catalog API が正常に有効になるはずです。

Data Catalog API の概要を表示する Google Cloud Data Catalog ウィンドウ

BigQuery コンソールを開く

  1. Google Cloud コンソールで、ナビゲーション メニュー > [BigQuery] を選択します。

[Cloud コンソールの BigQuery へようこそ] メッセージ ボックスが開きます。このメッセージ ボックスには、クイックスタート ガイドとリリースノートへのリンクが表示されます。

  1. [完了] をクリックします。

BigQuery コンソールが開きます。

タスク 2. データセットを作成する

  1. BigQuery の左側のナビゲーション パネルで、プロジェクト ID の横に表示される「アクションを表示」アイコンをクリックし、続いて [データセットを作成] をクリックします。

[アクションを表示] ナビゲーション メニュー。プロジェクトのサブメニュー内で [データセットを作成] オプションがハイライト表示されている。

  1. [データセットの作成] ダイアログで、次の操作を行います。
  • [データセット ID] に「demo_dataset」と入力します。

  • [マルチリージョン] で、[US(米国の複数のリージョン)] を選択します。

[データセットの作成] ページ。[プロジェクト ID]、[データセット ID]、[マルチリージョン] の各欄が入力されている。

  1. [データセットを作成] をクリックします。
注: Cloud コンソールを使用してデータセットを作成する場合、説明やラベルを追加することはできません。説明とラベルを追加できるのは、データセットが作成された後になります。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 データセットを作成する

タスク 3. データセットへの New York Taxi 一般公開テーブルのコピー

  1. 左側のパネルで、[+ データを追加] > [一般公開データセット] をクリックします。

  2. 検索バーに「NYC TLC Trips」と入力し、表示される結果をクリックします。

検索結果。[フィルタ条件] メニューの横にある「NYC TLC Trips」タイルがハイライト表示されている。

このラボでは、このデータセットのテーブルを使用します。これには 2018 年のニューヨーク市のタクシー賃走データが含まれています。

  1. 先に進む準備ができたら、サイドパネルの外をクリックし、コンソールに戻ります。

  2. Cloud Shell パネルで次のコマンドを実行して、tlc_yellow_trips_2018 テーブルをコピーします。[承認] をクリックします。

bq cp bigquery-public-data:new_york_taxi_trips.tlc_yellow_trips_2018 $(gcloud config get project):demo_dataset.trips

上記のコマンドは、bq コマンドライン ツールを使用して一般公開テーブルをプロジェクトにコピーし、先ほど作成した demo_dataset に配置しました。

  1. BigQuery ブラウザページを更新します。

  2. trips テーブルが demo_dataset にリストされていることを確認します。

固定されたプロジェクトの一覧。trips テーブルは demo_dataset 内のファイルとして表示されている。

次のセクションでは、このテーブルに Data Catalog タグを追加します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 New York Taxi 一般公開テーブルをデータセットにコピーする

タスク 4. Data Catalog タグ テンプレートを作成する

Data Catalog の UI でタグ テンプレートを作成します。

  1. Google Cloud コンソールのナビゲーション メニューナビゲーション メニュー)で、[すべてのプロダクトを表示] をクリックします。[アナリティクス] で、[Dataplex Universal Catalog] をクリックします。

  2. 左側のメニューの [メタデータを管理] で [カタログ] をクリックします。

  3. [タグ テンプレートを作成する(非推奨)] をクリックします。

  4. [続行してもよろしいですか?] と表示されたら、[続行] をクリックします。

注: タグ テンプレートはアスペクト タイプに置き換えられつつありますが、現時点ではまだ機能しています。次の手順に進んでタグ テンプレートを作成してください。
  1. テンプレート フォームに入力して、「Demo Tag Template」を定義します。
  • テンプレートの表示名: Demo Tag Template
  • テンプレート ID: demo_tag_template
  • ロケーション:

次に、4 つのタグ属性(タグ「フィールド」とも呼ばれます)を作成します。

  1. [フィールドを追加] をクリックします。

下記の値を持つ 4 つの属性を作成します。「ソース」属性は必須タグ属性を定義します。属性名には小文字とアンダースコアを使用できます。

  • フィールド表示名: Source of data asset
  • フィールド ID: source_of_data_asset
  • このフィールドを必須にする: オン
  • タイプ: 文字列
  1. [完了] をクリックします。

  2. [フィールドを追加] をクリックして、以下のように入力します。

  • フィールド表示名: Number of rows in data asset
  • フィールド ID: number_of_rows_in_data_asset
  • このフィールドを必須にする: オフ
  • タイプ: 倍精度
  1. [完了] をクリックします。

  2. [フィールドを追加] をクリックして、以下のように入力します。

  • フィールド表示名: Has PII
  • フィールド ID: has_pii
  • このフィールドを必須にする: オフ
  • タイプ: ブール値
  1. [完了] をクリックします。

  2. [フィールドを追加] をクリックして、以下のように入力します。

  • フィールド表示名: PII type
  • フィールド ID: pii_type
  • このフィールドを必須にする: オフ
  • タイプ: 列挙
  1. 次の 3 つの値を、この属性のオプションとして追加します。
  • Email
  • Social Security Number
  • None
  1. [完了] をクリックします。

完成したタグ テンプレート フォームには、次の 4 つのタグ属性がリストされます。

完成したタグ テンプレート フォーム、[公開設定] オプション、[作成] ボタン、[キャンセル] ボタン。

  1. [作成] をクリックします。

Data Catalog の [タグ テンプレート] ページには、テンプレートの詳細と属性が表示されます。

完成した Data Catalog。テンプレートの詳細、フィールド、表示名、タイプが表示されている。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 タグ テンプレートを作成する

タスク 5. 新しく作成したタグをテーブルに追加する

  1. データアセット内のテーブルにタグを付けるには、左上にある Data Catalog アイコンをクリックします。

  2. 左側のペインにある [検索] をクリックし、検索ボックスに「demo_dataset」と入力します。

  3. [検索] をクリックします。

Data Catalog ページ。検索バーに「demo_dataset」という検索キーワードが入力されている。

先ほどデータセットにコピーした demo_dataset と trips テーブルが検索結果に表示されます。

  1. trips」をクリックしてテーブルを開きます。

demo_dataset とその仕様が表示され、trips テーブルがハイライト表示されている。

[エンティティの詳細] ページが開きます。

  1. [タグを付ける] をクリックします。

[エンティティの詳細] ページ。[タグを付ける] ボタンがハイライト表示されている。

  1. [タグを付ける] ダイアログの「タグを付ける対象の選択」の下で trips テーブルを選択し、[OK] をクリックします。

  2. タグ テンプレートに「Demo Tag Template」を選択します。

  3. 次に、タグの各属性に次の値を挿入または選択します。

  • Source of data asset: tlc_yellow_trips_2018
  • PII type: NONE

[タグを付ける] ページ。Demo Tag Template 内では、[Source of data asset] と [PII type] が選択され、値が入力されている。

  1. [保存] をクリックします。

  2. Demo Tag Template」をクリックすると、タグ属性が [エンティティの詳細] ページに表示されます。

[エンティティの詳細] ページ。Demo Tag Template の表示名、データアセットのソース、および PII タイプが表示されている。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 タグをテーブルに添付する

お疲れさまでした

このラボでは、Data Catalog を使用して、タグをテーブルに正しく作成して添付する方法を学習しました。

次のステップと詳細情報

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2025 年 5 月 27 日

ラボの最終テスト日: 2025 年 5 月 27 日

Copyright 2025 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。

始める前に

  1. ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
  2. ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
  3. 画面左上の [ラボを開始] をクリックして開始します

シークレット ブラウジングを使用する

  1. ラボで使用するユーザー名パスワードをコピーします
  2. プライベート モードで [コンソールを開く] をクリックします

コンソールにログインする

    ラボの認証情報を使用して
  1. ログインします。他の認証情報を使用すると、エラーが発生したり、料金が発生したりする可能性があります。
  2. 利用規約に同意し、再設定用のリソースページをスキップします
  3. ラボを終了する場合や最初からやり直す場合を除き、[ラボを終了] はクリックしないでください。クリックすると、作業内容がクリアされ、プロジェクトが削除されます

このコンテンツは現在ご利用いただけません

利用可能になりましたら、メールでお知らせいたします

ありがとうございます。

利用可能になりましたら、メールでご連絡いたします

1 回に 1 つのラボ

既存のラボをすべて終了して、このラボを開始することを確認してください

シークレット ブラウジングを使用してラボを実行する

このラボの実行には、シークレット モードまたはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウントの競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。