实验设置说明和要求
保护您的账号和进度。请务必在无痕浏览器窗口中,使用实验凭证运行此实验。

探索 BigQuery

实验 1 小时 30 分钟 universal_currency_alt 5 个点数 show_chart 入门级
info 此实验可能会提供 AI 工具来支持您学习。
此内容尚未针对移动设备进行优化。
为获得最佳体验,请在桌面设备上访问通过电子邮件发送的链接。
重要图标 重要提示

桌面设备/笔记本电脑图标请务必仅在桌面设备/笔记本电脑上完成此实操实验。

勾选图标 每个实验仅允许尝试 5 次。

测验目标图标温馨提示:第一次尝试时,您可能无法答对所有问题,甚至可能需要重做任务,请不必担心,这都是学习过程的一部分。

计时器图标 实验一旦开始,计时器就无法暂停。1 小时 30 分钟后,实验将结束,您需要重新开始。

提示图标 如需了解详情,请阅读实验技术提示

活动概览

云数据分析采用各种工具,可在分析流程的各个阶段提供支持。BigQuery 和 Looker 是两款功能强大的热门工具,可在许多主流云平台上运行。

BigQuery 是一个全托管式企业数据仓库,可帮助您使用 Google Cloud 控制台界面管理和分析数据。借助 BigQuery,您可以使用 SQL 查询来检索、清理和整理数据,确保获得报告和分析所需的优质数据。您还可以使用 BigQuery 编写 SQL 查询,通过 JOIN 语句合并多个表中的数据。

Looker 是一个商业智能 (BI) 平台,可助您探索、分析、直观呈现和分享数据。Looker Studio 是 Looker 平台的一部分,可在 BigQuery 界面中轻松访问,您可以使用这款工具,将数据转换为内容详实且完全可自定义的信息中心和报告。

在本实验中,您将浏览 BigQuery 中的两个数据集,并运行 SQL 查询来过滤数据。然后,您将使用 Looker Studio 查看直观呈现的查询结果。

场景

恭喜!您被 TheLook eCommerce 聘为数据分析师。这是一家全球性公司,通过实体店和数字渠道(包括公司自有网站、自有移动应用和各种第三方社交媒体应用)销售服装产品。凭借丰富多样的服装款式、对创新的重视以及践行合乎道德的可持续采购,TheLook eCommerce 实现了快速增长。

TheLook eCommerce 计划投放一个广告系列,其中全美大学生体育协会 (NCAA) 中得分最高的大学篮球队员为该公司的服饰担任模特。营销经理 Martina 希望在该广告系列的第一阶段宣传泳装产品。

鉴于 6 月历来是该公司泳装销量最高的月份,为找出该月销量领先的泳装产品,Martina 要求您生成一份包含 2023 年 6 月泳装品类销售数据的报告。为了确定邀请哪些篮球队员在广告系列中出镜,您需要浏览 NCAA 的公共数据集,整理一份得分最高球员的汇总报告。

以下是任务的具体步骤:首先,您需要浏览 thelook_gcda 数据集中的表。接下来,您将对数据进行过滤,检索过去 30 天内售出的泳装产品的信息。第三步,浏览 ncaa_basketball 公共数据集中的表。最后,对数据进行过滤,检索得分最高的前 10 位篮球队员的相关信息。

设置

点击“开始实验”之前

请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。

此实操实验可让您在真实的云环境中开展活动,免受模拟或演示环境的限制。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。

为完成此实验,您需要:

  • 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
注意:请使用无痕模式或无痕浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。
  • 完成实验的时间 - 请注意,实验开始后无法暂停。
注意:如果您已有自己的个人 Google Cloud 账号或项目,请不要在此实验中使用,以避免您的账号产生额外的费用。

如何开始实验并登录 Google Cloud 控制台

  1. 点击开始实验按钮。左侧是实验详细信息面板,其中包含以下各项:

    • 剩余时间
    • 打开 Google Cloud 控制台按钮
    • 进行该实验时必须使用的临时凭证
    • 帮助您逐步完成本实验所需的其他信息(如果需要)
    注意:如果该实验需要付费,系统会打开一个弹出式窗口供您选择支付方式。
  2. 如果您使用的是 Chrome 浏览器,点击打开 Google Cloud 控制台(或右键点击并选择在无痕式窗口中打开链接)。系统会在新的浏览器标签页中打开登录页面。

    提示您可以将这些标签页分别放在不同的窗口中,并排显示,以便轻松切换。

    注意:如果您看到选择账号对话框,请点击使用其他账号
  3. 如有必要,请复制下方的 Google Cloud 用户名,然后将其粘贴到登录对话框中。点击下一步

{{{user_0.username | "Google Cloud username"}}}

您也可以在实验详细信息面板中找到 Google Cloud 用户名

  1. 复制下面的 Google Cloud 密码,然后将其粘贴到欢迎对话框中。点击下一步
{{{user_0.password | "Google Cloud password"}}}

您也可以在实验详细信息面板中找到 Google Cloud 密码

重要提示:您必须使用实验提供的凭证。请勿使用您的 Google Cloud 账号凭证。 注意:在本实验中使用您自己的 Google Cloud 账号可能会产生额外费用。
  1. 依次点击后续页面,完成以下步骤:
    • 接受条款及条件
    • 由于这是临时账号,请勿添加账号恢复选项或双重验证
    • 请勿用其注册免费试用服务

片刻之后,系统会在此标签页中打开 Google Cloud 控制台。

注意:您可以点击左上角的导航菜单来查看列有 Google Cloud 产品和服务的菜单。Google Cloud 控制台菜单,其中突出显示了导航菜单图标

任务 1. 浏览 thelook_gcda 数据集

在此任务中,您将浏览 thelook_gcda 数据集及其包含的表。然后,运行一个联接两个表的查询,检索 2023 年 6 月售出的泳装产品的数据。

  1. 在 Google Cloud 控制台的导航菜单 (导航菜单) 中,依次点击 BigQuery > Studio
注意:系统可能会显示欢迎在 Cloud 控制台中使用 BigQuery 消息框,其中包含指向快速入门指南和界面更新版本说明的链接。点击完成以继续。
  1. 在“探索器”中,展开您的项目
  2. 选择 thelook_gcda 数据集。
  3. 传统版探索器窗格中,展开 thelook_gcda 数据集。随即会显示该数据集中包含的表。您可能需要向下滚动才能查看完整列表。

在这一步中,您需要查看 2023 年 6 月售出的泳装产品数据。

  1. 选择 products 表。表架构随即显示。
  2. 选择预览标签页,查看数据。 请注意,每款产品在“id”列中都包含一个唯一标识符。

现在,查看 order_items 表和 products 表。要想查看 2023 年 6 月售出了多少件泳装产品,需要基于一个共同列联接这两个表。

  1. 在查询编辑器中,点击 SQL 查询 (+) 图标,打开一个新的未命名的查询标签页,以便在其中运行查询。
  2. 将以下命令复制和粘贴到未命名的查询标签页中:
注意:每次在查询编辑器中运行新查询时,您都可以选择替换旧查询,方法是在同一未命名的查询标签页中复制和粘贴新查询以覆盖旧查询;或者,您也可以选择点击 SQL 查询 (+) 图标,打开一个新的未命名的查询标签页,然后在其中运行查询。 SELECT o.order_id,p.name,p.brand,o.sale_price,o.created_at, o.status FROM `thelook_gcda.order_items` as o JOIN `thelook_gcda.products` as p ON o.product_id=p.id WHERE UPPER(p.category) like "SWIM" AND UPPER(o.status) NOT in ('RETURNED','CANCELED','CANCELLED') AND o.created_at >= '2023-06-01' AND o.created_at < '2023-07-01';
  1. 点击运行

此查询将联接 order_items 表和 products 表,并返回 2023 年 6 月所有未退货或未取消的泳装订单数据。

最后,使用 Looker Studio 浏览查询结果。

  1. 在“查询结果”窗格中,点击打开方式,然后选择 Looker Studio

  2. 在“查看数据访问权限”页面上,点击确认

点击检查我的进度,验证您是否已正确完成此任务。

浏览 thelook_gcda 数据集

任务 2. 浏览 NCAA Basketball 公共数据集

在此任务中,您将浏览 ncaa_basketball 公共数据集及其包含的表。然后,运行查询来检索得分最高的 NCAA 篮球队员的有关数据。最后,再次运行查询,对单场比赛中得分最高的前 10 位球员进行排名。

  1. 如果您尚未进入 BigQuery Studio,请在 Google Cloud 控制台的导航菜单 (导航菜单) 中,依次点击 BigQuery > Studio
  2. 点击“探索器”窗格,然后点击 + 添加数据,在项目中添加数据源。
  3. 添加数据页面上,从左下角选择公共数据集。随即会出现 Marketplace 页面。
  4. 在搜索字段中输入 ncaa,然后按 Enter 键。
  5. 选择 NCAA Basketball数据集。
  6. 产品详情页面上,点击查看数据集,即可查看此 BigQuery 公共数据集的详细数据架构。
  7. ncaa_basketball 数据集已预先填充,系统会显示此数据集中的表。

首先,您需要统计每位球员在所有比赛中累计获得的得分总和。

  1. 预览 ncaa_basketball 数据集中的每个表。
  2. 选择 mbb_players_games_sr 表。您认为哪些列有助于找到得分最高的球员?

mbb_players_games_sr 表中的每一行都记录了某位球员在某场比赛中的得分情况。如需获取每位球员每场比赛的得分总和,您需要运行一个汇总所有比赛数据的查询。

  1. 将以下查询复制到查询编辑器
SELECT first_name, last_name, team_name, sum(points) as total_points FROM `bigquery-public-data.ncaa_basketball.mbb_players_games_sr` group by first_name, last_name, team_name order by total_points desc;

此查询将为每位球员返回一行结果,显示其所属球队以及球员在所有参赛比赛中的得分总和。

  1. 点击运行

现在,您需要找到单场比赛中得分最高的前 10 位球员。

  1. 将以下查询复制到查询编辑器
WITH rankings AS ( SELECT RANK() OVER (ORDER BY points DESC) AS ranking, first_name, last_name, team_name, points FROM `bigquery-public-data.ncaa_basketball.mbb_players_games_sr` ) SELECT ranking , first_name, last_name, team_name, points FROM rankings WHERE ranking<=10 ORDER BY ranking;

此查询将根据 NCAA 篮球队员在比赛中的得分,返回所有球员中得分最高的前 10 名,并按从 1 到 10 的顺序进行排名。

请注意,此查询包含两个 SELECT 语句。第一个 SELECT 语句会创建一个名为“rankings”的临时表。第二个 SELECT 语句会从 rankings 表中选择以下列。

RANK() 函数用于根据每位球员的得分为其分配排名。

  1. 点击运行
注意:您仍然可以使用 Looker Studio 浏览查询结果,方法是点击探索数据,然后选择通过 Looker Studio 探索 注意:结果显示,有几位球员的得分相同,在这种情况下,RANK() 函数会为其分配相同的排名。

当您对并列值进行排名时,最好了解 ROW_NUMBERDENSE_RANKRANK 函数之间的区别。

  • ROW_NUMBER() 会忽略并列。如果您想任意返回得分最高的前 10 位球员,此函数可能适用。
  • DENSE_RANK()RANK() 则会考虑并列,并以不同方式对并列值进行排名。
  • DENSE_RANK() 不会跳号,因此排名将为 1、2、2、3。
  • RANK() 会跳号,因此排名将为 1、2、2、4。

点击检查我的进度,验证您是否已正确完成此任务。

浏览 NCAA Basketball 公共数据集

总结

太棒了!

作为 TheLook eCommerce 的云数据分析师,您已成功向营销团队提供其所需数据,协助他们着手开展广告系列的初步工作。该广告系列将邀请 NCAA 篮球队员出镜宣传公司的泳装产品,令人期待。

通过探索 thelook_gcda 数据集中的表并过滤数据,您获得了 2023 年 6 月售出的泳装产品信息。

您还对 ncaa_basketball 公共数据集中的表进行了过滤,以检索得分最高的篮球队员的有关信息。

借助上述信息,营销团队可以就以下方面做出明智的决策:应在广告系列中重点展示哪些泳装产品,以及应邀请哪些表现出色的球员出镜展示这些产品。

您正在逐步掌握如何使用强大的云端工具来分析数据。太棒了!

结束实验

结束实验之前,请确保您已完成所有任务。准备就绪后,点击结束实验,然后点击提交

结束实验后,您将无法再访问实验环境,也无法再访问您在其中完成的工作成果。

版权所有 2026 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名称和产品名称可能是其各自相关公司的商标。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

使用无痕模式或无痕浏览器窗口是运行此实验的最佳方式。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。