arrow_back

从 BigQuery 数据中挖掘数据洞见:实验室挑战赛

登录 加入
访问 700 多个实验和课程

从 BigQuery 数据中挖掘数据洞见:实验室挑战赛

实验 1 小时 30 分钟 universal_currency_alt 5 个积分 show_chart 中级
info 此实验可能会提供 AI 工具来支持您学习。
访问 700 多个实验和课程

GSP787

Google Cloud 自学实验的徽标

概览

您必须在分配的时间段内完成一系列任务。您会获得一个场景和一系列任务,您需自行找到完成任务的方法,而不是按照分步说明进行操作。自动评分系统(显示在本页中)会提供有关您是否正确完成任务的反馈。

要获得 100% 的分数,您必须在该时间段内完成所有任务!

在您参加实验室挑战赛期间,我们不会再教授 Google Cloud 的概念知识。请利用从本实验室挑战赛所属课程中的各个实验里学到的技能,为即将呈现的挑战构建适合的解决方案。在本挑战赛中,您需要拓展所学技能,并更正无法正常运行的查询。

我们建议已报名参加从 BigQuery 数据中挖掘数据洞见技能徽章课程的学员参加此实验室挑战赛。准备好接受挑战了吗?

设置和要求

点击“开始实验”按钮前的注意事项

请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。

此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。

为完成此实验,您需要:

  • 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
注意:请使用无痕模式(推荐)或无痕浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。
  • 完成实验的时间 - 请注意,实验开始后无法暂停。
注意:请仅使用学生账号完成本实验。如果您使用其他 Google Cloud 账号,则可能会向该账号收取费用。

场景

您是一家公共卫生组织的成员,该机构需要确定与新型冠状病毒肺炎 (COVID-19) 疫情相关的查询的解答。获得正确的解答将有助于该组织合理规划和集中医疗资源及认知宣传计划。

用于本次分析的数据集和表如下所示:bigquery-public-data.covid19_open_data.covid19_open_data。此存储库包含全球范围内与 COVID-19 相关的每日时序数据的数据集(国家/地区层级),其中包括与人口统计学特征、经济、流行病学、地理位置、健康、住院治疗、流动性、政府响应和天气有关的数据。

任务 1. 确诊病例总数

  • 构建一个查询,以解答“这一天的确诊病例总数是多少?”。该查询需要以单行返回结果,其中包含所有国家/地区确诊病例数的总和。该列的名称应为 total_cases_worldwide

要引用的列:

  • cumulative_confirmed
  • date

点击“检查我的进度”以验证是否完成了以下目标: 确诊病例总数

任务 2. 受影响最严重的区域

  • 构建一个查询,以解答“这一天,美国有多少州的死亡人数超过 ?”。该查询需要在 count_of_states 字段中列出输出结果。
注意:请勿包括 Null 值。

要引用的列:

  • country_name
  • subregion1_name(州信息)
  • cumulative_deceased

点击“检查我的进度”以验证是否完成了以下目标: 受影响最严重的区域

任务 3. 确定热点

  • 构建一个查询,以解答“列出 这一天美国确诊病例数超过 的所有州?”。该查询需返回州名和对应的确诊病例数,并以降序排列。需要返回的字段名称:statetotal_confirmed_cases

要引用的列:

  • country_code
  • subregion1_name(州信息)
  • cumulative_confirmed

点击“检查我的进度”以验证是否完成了以下目标: 确定热点

任务 4. 死亡率

  1. 构建一个查询,以解答“2020 年 月,意大利的病死率是多少?”。病死率在此处的定义为:(总死亡人数/确诊病例总数)* 100%。
  2. 编写查询,以返回 2020 年 月的病死率,并在输出中包含以下字段:total_confirmed_casestotal_deathscase_fatality_ratio

要引用的列:

  • country_name
  • cumulative_confirmed
  • cumulative_deceased

点击“检查我的进度”以验证是否完成了以下目标: 死亡率

任务 5. 确定具体日期

  • 构建一个查询,以解答“意大利的总死亡人数在哪一天超过了 ?”。该查询应以 yyyy-mm-dd 格式返回日期。

要引用的列:

  • country_name
  • cumulative_deceased

点击“检查我的进度”以验证是否完成了以下目标: 确定具体日期

任务 6. 找出哪些天的新增病例数为零

以下查询用于确定在 期间,印度确诊病例数零增长的天数。不过此查询无法正常执行。

  • 您需要更新该查询才能完成查询,并获得结果:
WITH india_cases_by_date AS ( SELECT date, SUM(cumulative_confirmed) AS cases FROM `bigquery-public-data.covid19_open_data.covid19_open_data` WHERE country_name="India" AND date between '{{{project_0.startup_script.start_date_india_code}}}' and '{{{project_0.startup_script.close_date_india_code}}}' GROUP BY date ORDER BY date ASC ) , india_previous_day_comparison AS (SELECT date, cases, LAG(cases) OVER(ORDER BY date) AS previous_day, cases - LAG(cases) OVER(ORDER BY date) AS net_new_cases FROM india_cases_by_date )

点击“检查我的进度”以验证是否完成了以下目标: 找出哪些天的新增病例数为零

任务 7. 翻倍率

  • 使用上一个查询作为模板,编写一个查询,找出在 2020 年 3 月 22 日至 2020 年 4 月 20 日期间,美国有哪些天的确诊病例数与前一天相比增加了 % 以上(表示大约 7 天的翻倍率)。该查询需要返回日期列表、当天的确诊病例数,前一天的确诊病例数以及这两天确诊病例数增加的百分比。

    • 返回的字段应使用以下名称:DateConfirmed_Cases_On_DayConfirmed_Cases_Previous_DayPercentage_Increase_In_Cases

点击“检查我的进度”以验证是否完成了以下目标: 翻倍率

任务 8. 恢复率

  1. 构建一个查询,以列出到 2020 年 5 月 10 日这一天,相关国家/地区的恢复率(按降序排列,限制为 条)。

  2. 将查询范围限定为仅查询确诊病例数超过 5 万的国家/地区。

    • 该查询需要返回以下字段:countryrecovered_casesconfirmed_casesrecovery_rate

要引用的列:

* country_name * cumulative_confirmed * cumulative_recovered

点击“检查我的进度”以验证是否完成了以下目标: 恢复率

任务 9. CDGR - 累计每日增长率

  • 以下查询试图计算自报告首例病例以来,法国在 的累计每日增长率。首例病例报告于 2020 年 1 月 24 日。

  • CDGR 的计算方式为:

((last_day_cases/first_day_cases)^1/days_diff)-1)

其中:

  • last_day_cases 是 2020 年 5 月 10 日的确诊病例数

  • first_day_cases 是 2020 年 1 月 24 日的确诊病例数

  • days_diff 是 2020 年 1 月 24 日至 2020 年 5 月 10 日之间的天数

  • 此查询无法正常执行。您能否修正错误,让该查询成功执行?

WITH france_cases AS ( SELECT date, SUM(cumulative_confirmed) AS total_cases FROM `bigquery-public-data.covid19_open_data.covid19_open_data` WHERE country_name="France" AND date IN ('2020-01-24', '{{{project_0.startup_script.date_code}}}') GROUP BY date ORDER BY date) , summary as ( SELECT total_cases AS first_day_cases, LEAD(total_cases) AS last_day_cases, DATE_DIFF(LEAD(date) OVER(ORDER BY date),date, day) AS days_diff FROM france_cases LIMIT 1 ) select first_day_cases, last_day_cases, days_diff, SQRT((last_day_cases/first_day_cases),(1/days_diff))-1 as cdgr from summary 注意:请参阅以下函数、运算符和条件文档,详细了解引用“LEAD()”的 SQL 函数。

点击“检查我的进度”以验证是否完成了以下目标: CDGR - 累计每日增长率

任务 10. 创建 Looker Studio 报告

  • 创建 Looker Studio 报告,针对美国地区绘制以下数据图表:

    • 确诊病例数
    • 死亡人数
    • 日期范围:

点击“检查我的进度”以验证是否完成了以下目标: 创建 Looker Studio 报告

注意:创建报告时,请使用下图作为参考,并确保您的报告与之类似。 注意:请勿使用 BigQuery 中的通过 Looker Studio 进行探索选项。

线形图

恭喜!

“从 BigQuery 数据中挖掘数据洞见”徽章

赢得您的下一个技能徽章

本自学实验是从 BigQuery 数据中挖掘数据洞见技能徽章课程的组成部分。完成此技能徽章挑战任务可赢得上面的徽章,以表彰您取得的成就。您可以在简历和社交平台中分享自己的徽章,并使用 #GoogleCloudBadge 让大家知道您取得的这一成就。

本技能徽章课程是 Google 的数据分析师学习路线的组成部分。如果您已完成此学习路线中的其他技能徽章课程,可在 Google Cloud Skills Boost 目录中搜索您可以报名参加的其他技能徽章课程。

Google Cloud 培训和认证

…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。

本手册的最后更新时间:2024 年 3 月 27 日

本实验的最后测试时间:2024 年 3 月 27 日

版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

请使用无痕模式或无痕式浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。