始める前に
- ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
- ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
- 画面左上の [ラボを開始] をクリックして開始します
Enable sensitive data protection for Cloud Storage
/ 40
Enable sensitive data protection for BigQuery
/ 30
Protect sensitive data in Gen AI model responses
/ 30
チャレンジラボでは、シナリオと一連のタスクが提供されます。手順ガイドに沿って進める形式ではなく、コース内のラボで習得したスキルを駆使して、ご自身でタスクを完了していただきます。タスクが適切に完了したかどうかは、このページに表示される自動スコアリング システムで確認できます。
チャレンジラボは、Google Cloud の新しいコンセプトについて学習するためのものではありません。デフォルト値を変更する、エラー メッセージを読み調査を行ってミスを修正するなど、習得したスキルを応用する能力が求められます。
100% のスコアを達成するには、制限時間内に全タスクを完了する必要があります。
このラボは、「エコシステム全体で機密データを検出して保護する」コースに登録している受講者を対象としています。準備が整ったらチャレンジを開始しましょう。
あなたは Cymbal Cars のデータ エンジニアです。組織のデータ エコシステム全体にわたり、お客様(車の所有者)の機密データを特定して保護する役割を任されました。
同僚はすでに、組織内の Cloud Storage のファイルや BigQuery テーブルに存在する機密データ(特に米国の社会保障番号)を特定し秘匿化する作業を完了しており、さらに生成 AI モデルの回答に含まれる機密データの特定と秘匿化も実施済みです。
Cloud Storage のファイルと BigQuery のアセットが定期的にスキャンされて保護されるように、Sensitive Data Protection の検出を設定してジョブを実行し、クレジット カード番号などの機密データを特定および秘匿化する必要があります。
組織の生成 AI モデルについては、同僚が以前に行った作業を拡張し、モデルの回答内で認証情報が特定された際に、該当箇所を秘匿化できるようにしたいと考えています。
このチャレンジでは、Sensitive Data Protection ツールに関する知識を活用して、Cloud Storage と BigQuery に保存されたデータの検出と保護を実装します。さらに、Cloud Data Loss Prevention(DLP)API の Python クライアントを使用して、認証情報を含む生成 AI モデルの回答を特定して秘匿化します。
このラボ環境では次の設定を使用します。
こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。
このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
チームには、gs://sample-chat-log-data-10.csv)。
目標は、新しく追加された CSV ファイルに含まれるクレジット カード番号を特定して秘匿化することです。さらに、バケットの毎日の検出を有効にし、今後追加される機密データもモニタリングできるようにします。
これらの目標を達成するために、次のサブタスクを完了します。
参考になるガイダンスは、以下のヒントをご覧ください。
検出スキャンに関するヒントについては、
| プロパティ | 値 |
|---|---|
| スコープの選択 | 選択したプロジェクトをスキャン |
| 管理されたスケジュール | [デフォルトのスケジュール] を編集して、[スケジュールを設定] と [検査テンプレートの変更] の両方で、[毎日再プロファイリングする] を指定する |
| 検査テンプレートの選択 | 新しい検査テンプレートの作成 |
| データ プロファイルのコピーを BigQuery に保存する | 現在のプロジェクトで、[データセット ID] を [cs_discovery] に、[テーブル ID] を [cs_data_profiles] に設定する |
| 構成を保存するロケーションの設定 | [Multi_region] > [us(米国の複数のリージョン)] |
| 構成の表示名 | Cloud Storage Daily Discovery |
匿名化テンプレートに関するヒントについては、
| プロパティ | 値 |
|---|---|
| テンプレート ID | us_ccn_deidentify |
| データ変換のタイプ | 記録 |
| 表示名 | クレジット カード番号の匿名化 |
| ロケーション タイプ | Multi_region > global(グローバル) |
| 変換ルールのフィールド | message |
| 変換タイプ | infoType に基づく一致 |
| 変換方法 | infoType 名での置換 |
匿名化ジョブに関するヒントについては、
| プロパティ | 値 |
|---|---|
| ジョブ ID | us_ccn_deidentify |
| ロケーション タイプ | [Multi_region] > [us(米国の複数のリージョン)] |
| URL | gs:// |
| スキャンの繰り返し | このオプションを有効にする |
| サンプリング | 100% |
| サンプリング方法 | サンプリングなし |
| 構造化された匿名化テンプレート | ステップ 2 で作成した匿名化テンプレートのパスを指定する |
| 変換の詳細を BigQuery にエクスポートする | 現在のプロジェクトで、[データセット ID] を [cs_transformations] に、[テーブル ID] を [deidentify_ccn] に設定する |
| Cloud Storage 出力先 | gs:// |
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
自動車の所有者情報や購入データも分析用途で BigQuery に保存されており、一部のデータセットには機密データが含まれています。個人を特定できる機密情報(SPII)のタグを IAM で作成し、それを使って、SPII タグが付いていない BigQuery データセットにのみ特定のユーザーがアクセスできるように、条件付きアクセス権を付与する作業を任されています。
この目標を達成するために、次のサブタスクを完了します。
参考になるガイダンスは、以下のヒントをご覧ください。
タグを作成する際のヒントについては、
| プロパティ | 値 |
|---|---|
| タグキー | SPII |
| タグキーの説明 | 個人を特定できる機密情報(SPII)を示すフラグ |
| タグのキー値 1 | あり |
| タグのキー値 1 の説明 | 個人を特定できる機密情報(SPII)が含まれている |
| タグのキー値 2 | なし |
| タグのキー値 2 の説明 | 個人を特定できる機密情報(SPII)が含まれていない |
条件付きアクセス権を付与する際のヒントについては、
| プロパティ | 値 |
|---|---|
| ユーザー名 2 の IAM ロール | [閲覧者] を [参照者] に置き換え、[BigQuery データ閲覧者] はそのまま残して条件を追加する |
| 条件のタイトル | SPII アクセスなしのみ |
| 条件タイプ 1 と演算子 | [タグ] と [値がある] を選択する |
| 条件タイプ 1 の値のパス |
car_owners データセットとは異なり、orders データセットには SPII は含まれておらず、注文の詳細のみが含まれています。
テスト(省略可): この条件付きアクセスが正しく機能していることを確認するには、ユーザー名 2 としてプロジェクトにログインし、BigQuery に移動します。[エクスプローラ] のリストで orders という名前のデータセットだけが残るまでページを更新します。これは、ユーザー名 2 が [SPII] の値が「なし」とタグ付けされたデータセットにのみアクセスできるよう制限されているためです。
なお、条件が反映されるまで数分かかることがあります。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
チームには、生成 AI モデルの回答に含まれる機密データの種類を特定して、それを秘匿化またはブロックする Python 関数がすでにあります。この関数を拡張して、米国の車両識別番号を含む生成 AI モデルの回答をブロックするよう依頼されました。車両識別番号は、北米の公道を走る自動車に割り当てられた固有の 17 桁のコードで構成される機密データです。
この目標を達成するために、このラボ環境で提供されているノートブックを使用して、次のサブタスクを完了します。
4Y1SL65848Z411439 は、米国の車両識別番号(VIN)の例ですか?
vertex-ai-jupyterlab という Workbench インスタンスで、事前に作成された deidentify-model-response-challenge-lab.ipynb という名前のノートブックを使用してください。
1. JupyterLab のブラウザタブを閉じて、Workbench のホームページに戻ります。
2. インスタンス名の横にあるチェックボックスをオンにして、[リセット] をクリックします。
3. [JupyterLab を開く] ボタンが再度有効になったら、1 分待ってから [JupyterLab を開く] をクリックします。
Python 関数の更新とテストに関するヒントについては、
Temperature を 0 に設定する際のヒントについては、
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
このラボでは、Cloud Storage の検出スキャン構成を作成し、スケジュールを設定しました。続いて、匿名化テンプレートを作成し、Cloud Storage ファイルへの匿名化ジョブを実行しました。さらに、IAM タグを作成して BigQuery データに適用し、条件付きアクセス権を付与しました。最後に、Cloud Data Loss Prevention(DLP)API で特定された機密データを含む生成 AI モデルの回答の秘匿化やブロックを行うよう、Python 関数を更新しました。
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2025 年 10 月 30 日
ラボの最終テスト日: 2025 年 10 月 30 日
Copyright 2025 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。
このコンテンツは現在ご利用いただけません
利用可能になりましたら、メールでお知らせいたします
ありがとうございます。
利用可能になりましたら、メールでご連絡いたします
1 回に 1 つのラボ
既存のラボをすべて終了して、このラボを開始することを確認してください