实验设置说明和要求
保护您的账号和进度。请务必在无痕浏览器窗口中,使用实验凭据运行此实验。

在 Cloud Storage 上创建流式数据湖:实验室挑战赛

实验 45 分钟 universal_currency_alt 1 个点数 show_chart 入门级
info 此实验可能会提供 AI 工具来支持您学习。
此内容尚未针对移动设备进行优化。
为获得最佳体验,请在桌面设备上访问通过电子邮件发送的链接。

ARC110

Google Cloud 自学实验的徽标

概览

在实验室挑战赛中,我们会为您提供一个场景和一系列任务。您将使用从课程的各个实验中学到的技能自行确定如何完成这些任务,而不是按照分步说明进行操作。自动评分系统(显示在本页面中)会提供有关您是否已正确完成任务的反馈。

在您参加实验室挑战赛期间,我们不会再教授新的 Google Cloud 概念知识。您需要拓展所学的技能,例如通过更改默认值和查看并研究错误消息来更正您自己所犯的错误。

要想获得满分,您必须在该时间段内成功完成所有任务!

设置

点击“开始实验”按钮前的注意事项

请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。

此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。

为完成此实验,您需要:

  • 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
注意:请使用无痕模式(推荐)或无痕浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。
  • 完成实验的时间 - 请注意,实验开始后无法暂停。
注意:请仅使用学生账号完成本实验。如果您使用其他 Google Cloud 账号,则可能会向该账号收取费用。

挑战场景

您刚开始担任初级数据工程师。到目前为止,您一直在帮助各团队使用 Pub/Sub、Dataflow 和 Cloud Storage 来创建和管理数据。

您应该掌握了完成这些任务所需的技能和知识。

您的挑战

您需要去帮助一个新组建的开发团队,完成实时消息流式传输项目的一些初始工作。您已经被指派协助该团队模拟使用 Pub/Sub 和 Dataflow,将实时消息流式传输到 Cloud Storage;您收到请求,需要完成以下任务:

  • 使用命令行创建 Pub/Sub 主题。
  • 使用命令行创建 Cloud Scheduler 作业,以定期向 Pub/Sub 发布消息。
  • 使用命令行创建 Cloud Storage 存储桶,作为 Dataflow 作业的输出目标位置。
  • 使用命令行创建并运行 Dataflow 作业,将数据从 Pub/Sub 主题流式传输到 Cloud Storage 存储桶,然后检查 Cloud Storage 存储桶中的输出文件。

您应当遵循如下标准:

  • 确保已成功启用任何所需的 API,例如 Dataflow。
  • 除非另有指示,否则应在 区域中创建所有资源。
  • 除非另有指示,否则应在 Cloud Shell 中完成实验室挑战赛,而不是在控制台中完成。
注意:在执行 Dataflow 流水线之前,请务必先停用后启用 Dataflow API。

下文详细说明了您的每项任务,祝您好运!

任务 1. 创建 Pub/Sub 主题

  • 使用命令行创建名为 的 Pub/Sub 主题。

点击检查我的进度以验证是否完成了以下目标: 创建 Pub/Sub 主题

任务 2. 创建 Cloud Scheduler 作业

  1. 使用命令行为您的项目创建 App Engine 应用。
  2. 使用命令行在此项目中创建 Cloud Scheduler 作业,以一分钟为间隔定期向任务 1 中的 Pub/Sub 主题发布消息。消息正文:
  3. 使用命令行启动调度器作业。

点击检查我的进度以验证是否完成了以下目标: 创建 Cloud Scheduler 作业

任务 3. 创建 Cloud Storage 存储桶

  • 使用命令行创建 Cloud Storage 存储桶,并将该存储桶命名为:

点击检查我的进度以验证是否完成了以下目标: 创建 Cloud Storage 存储桶

任务 4. 运行 Dataflow 流水线,将数据从 Pub/Sub 主题流式传输到 Cloud Storage

  1. 使用命令行创建并运行 Dataflow 作业,将数据从 Pub/Sub 主题流式传输到 Cloud Storage 存储桶。
  • 自行选择使用 Java 或 Python 脚本。GitHub 页面上提供了示例代码:java-docs-samplespython-docs-samples
  • 使用您在任务 1 中创建的 Pub/Sub 主题。
  • 使用您在任务 3 中创建的 Cloud Storage 存储桶作为输出位置。
  • 按照 2 分钟的固定时段对消息进行分组。
  1. 使用命令行检查哪些文件已写入到 Cloud Storage 中。

点击检查我的进度以验证是否完成了以下目标: 运行 Dataflow 流水线,将数据从 Pub/Sub 主题流式传输到 Cloud Storage

恭喜!

“在 Cloud Storage 上创建流式数据湖”徽章

赢得您的下一个技能徽章

本自学实验是在 Cloud Storage 上创建流式数据湖技能徽章挑战任务的组成部分。完成此技能徽章挑战任务可赢得上面的徽章,以表彰您取得的成就。您可以在简历和社交平台中分享自己的徽章,并使用 #GoogleCloudBadge 让大家知道您取得的这一成就。

Google Cloud 培训和认证

…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。

上次更新手册的时间:2023 年 9 月 20 日

上次测试实验的时间:2023 年 9 月 20 日

版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

请使用无痕模式或无痕式浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。