准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
Enable sensitive data protection for Cloud Storage
/ 40
Enable sensitive data protection for BigQuery
/ 30
Protect sensitive data in Gen AI model responses
/ 30
在实验室挑战赛中,我们会为您提供一个场景和一系列任务。您将使用从课程的各个实验中学到的技能自行确定如何完成这些任务,而不是按照分步说明进行操作。自动评分系统(显示在本页面中)会提供有关您是否已正确完成任务的反馈。
在您参加实验室挑战赛期间,我们不会再教授新的 Google Cloud 概念知识。您需要拓展所学的技能,例如通过更改默认值和查看并研究错误消息来更正您自己所犯的错误。
要想获得满分,您必须在该时间段内成功完成所有任务!
建议已报名参加在整个生态系统中发现并保护敏感数据课程的学员参加此实验室挑战赛。准备好接受挑战了吗?
您是 Cymbal Cars 的一名数据工程师,负责在贵组织的数据生态系统中识别并保护客户(车主)的敏感数据。
您的同事之前已经完成了部分工作,旨在识别和隐去您组织的 Cloud Storage 文件和 BigQuery 表中的敏感数据(特别是美国社会保障号),以及您组织的生成式 AI 模型回答中的敏感信息。
为确保定期扫描和保护 Cloud Storage 文件和 BigQuery 资产,您需要设置 Sensitive Data Protection 发现作业,并运行这些作业来识别和隐去其他敏感数据,例如信用卡号。
对于您组织的生成式 AI 模型,您还想在同事之前所完成工作的基础上进行扩展,以便在发现回答中包含凭证时,隐去回答内容。
在本挑战赛中,您将运用所掌握的 Sensitive Data Protection 工具知识,对 Cloud Storage 和 BigQuery 中的数据执行发现和保护,并使用 Cloud Data Loss Prevention (DLP) API 的 Python 客户端来识别和隐去包含凭证的生成式 AI 模型回答。
在本实验中,请使用以下详细信息来设置实验环境:
请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。
此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。
为完成此实验,您需要:
您的团队有一个名为 gs://sample-chat-log-data-10.csv)。
您的目标是识别并隐去新 CSV 文件中的信用卡号,并为存储桶启用每日发现功能,以便监控今后新出现的敏感数据实例。
为帮助您实现这些目标,请完成以下子任务。
展开下面的提示,获取一些可助您入门的实用指南!
有关发现扫描的实用技巧!
| 属性 | 值 |
|---|---|
| 选择范围 | 扫描所选项目 |
| 托管式时间表 | 修改默认时间表,将按时间表和检查模板发生更改时的设置指定为每日重新分析 |
| 选择检查模板 | 创建新的检查模板 |
| 将数据配置文件副本保存到 BigQuery | 在当前项目中,将数据集 ID 设置为 cs_discovery,并将表 ID 设置为 cs_data_profiles |
| 设置用于存储配置的位置 | Multi_region > us(美国的多个区域) |
| 配置的显示名称 | Cloud Storage Daily Discovery |
有关去标识化模板的实用技巧!
| 属性 | 值 |
|---|---|
| 模板 ID | us_ccn_deidentify |
| 数据转换类型 | 录制 |
| 显示名称 | 对信用卡号进行去标识化处理 |
| 位置类型 | Multi_region > global(全球) |
| 转换规则的字段 | message |
| 转换类型 | 按 infoType 匹配 |
| 转换方法 | 替换为 infoType 名称 |
有关去标识化作业的实用提示!
| 属性 | 值 |
|---|---|
| 任务 ID | us_ccn_deidentify |
| 位置类型 | Multi_region > us(美国的多个区域) |
| 网址 | gs:// |
| 以递归方式扫描 | 启用此选项 |
| 采样 | 100% |
| 采样方法 | 无采样 |
| 结构化的去标识化模板 | 指定您在第 2 步中创建的去标识化模板的路径 |
| 将转换详细信息导出到 BigQuery | 在当前项目中,将数据集 ID 设置为 cs_transformations,将表 ID 设置为 deidentify_ccn |
| Cloud Storage 输出位置 | gs:// |
点击检查我的进度以验证是否完成了以下目标:
为了便于分析,汽车车主及其购买行为的数据也存储在 BigQuery 中,其中一些数据集包含敏感数据。您的任务是在 IAM 中创建一个标记,用于标记敏感的个人身份信息 (SPII),并使用该标记为某些用户授予条件式访问权限,使其只能访问没有 SPII 标记的 BigQuery 数据集。
为帮助您实现这一目标,请完成以下子任务。
展开下面的提示,获取一些可助您入门的实用指南!
有关创建标记的实用技巧!
| 属性 | 值 |
|---|---|
| 标记键 | SPII |
| 标记键说明 | 标记敏感的个人身份信息 (SPII) |
| 标记键值对 1 | 是 |
| 标记键值 1 说明 | 包含敏感的个人身份信息 (SPII) |
| 标记键值 2 | 否 |
| 标记键值 2 说明 | 不包含敏感的个人身份信息 (SPII) |
有关授予条件式访问权限的实用技巧!
| 属性 | 值 |
|---|---|
| Username 2 的 IAM 角色 | 将 Viewer 替换为 Browser,并保留 BigQuery Data Viewer 以添加条件。 |
| 条件标题 | No SPII Access Only |
| 条件类型 1 和运算符 | 选择标记和有值 |
| 条件类型 1 的值路径 |
与 car_owners 数据集不同,orders 数据集不包含 SPII,而只包含订单详细信息。
可选测试:如果您想查看此条件式访问权限的实际效果,可使用 Username 2 的身份登录项目,然后前往 BigQuery。刷新页面,直到探索器列表中只剩下名为 orders 的数据集,因为 Username 2 现在只能访问 SPII 标记为否的数据集。
请注意,应用此条件可能需要几分钟时间。
点击检查我的进度以验证是否完成了以下目标:
您的团队已经有一个 Python 函数,可用于识别和隐去(或阻止)生成式 AI 模型回答中的敏感数据类型。您需要扩展该函数,以阻止包含美国车辆识别号的生成式 AI 模型回答。车辆识别号是一种敏感数据,由分配给北美地区每辆道路机动车的唯一 17 位代码组成。
为帮助您实现这一目标,请使用本实验环境中提供的笔记本来完成以下子任务:
Is 4Y1SL65848Z411439 an example of a US Vehicle Identification Number (VIN)?
请务必使用 Workbench 实例 vertex-ai-jupyterlab 中预先创建的笔记本 deidentify-model-response-challenge-lab.ipynb。
1. 关闭 JupyterLab 的浏览器标签页,然后返回 Workbench 首页。
2. 选中实例名称旁边的复选框,然后点击重置。
3. 在打开 JupyterLab 按钮重新启用后,等待一分钟,然后点击打开 JupyterLab。
有关更新和测试 Python 函数的实用提示!
有关将温度设置为 0 的实用技巧!
点击检查我的进度以验证是否完成了以下目标:
在本实验中,您为 Cloud Storage 创建并安排了发现扫描配置,然后创建了一个去标识化模板,并使用该模板对 Cloud Storage 文件运行了去标识化作业。您还创建了 IAM 标记并将其应用于 BigQuery 数据,以授予条件式访问权限。最后,您更新了一个 Python 函数,以隐去和阻止包含敏感数据(由 Cloud Data Loss Prevention (DLP) API 识别)的生成式 AI 模型回答。
…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。
上次更新手册的时间:2025 年 10 月 30 日
上次测试实验的时间:2025 年 10 月 30 日
版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验