实验设置说明和要求
保护您的账号和进度。请务必在无痕浏览器窗口中,使用实验凭证运行此实验。

BigQuery 足球数据注入

实验 15 分钟 universal_currency_alt 1 个点数 show_chart 入门级
info 此实验可能会提供 AI 工具来支持您学习。
此内容尚未针对移动设备进行优化。
为获得最佳体验,请在桌面设备上访问通过电子邮件发送的链接。

GSP848

Google Cloud 自学实验的徽标

概览

信息访问通常涉及多种数据格式,而 BigQuery 可以简化多数据源的处理过程。在本实验中,您将通过将外部体育数据源导入 BigQuery 表,开启体育数据科学的实践。这将为您在后续实验中构建更复杂的分析奠定基础。

本实验中使用的数据来自以下来源:

  • Pappalardo 等 (2019) A public data set of spatio-temporal match events in soccer competitions(关于足球比赛中时空匹配事件的公开数据集),Nature 旗下《Scientific Data》期刊第 6 卷第 236 号文章。https://www.nature.com/articles/s41597-019-0247-7
  • Pappalardo 等 (2019) PlayerRank: Data-driven Performance Evaluation and Player Ranking in Soccer via a Machine Learning Approach(PlayerRank:基于机器学习方法的足球比赛数据驱动型表现评估与球员排名),《ACM Transactions on Intelligent Systems and Technologies》(TIST) 第 10 卷第 5 期第 59 号文章(2019 年 9 月发表),共 27 页。DOI:https://doi.org/10.1145/3343172

学习内容

在本实验中,您将学习如何完成以下操作:

  • 使用 Cloud 控制台将 Google Cloud Storage 中的文件上传到 BigQuery 表中。
  • 使用 Cloud 控制台访问基于 BigQuery 表生成的信息。
  • 了解如何针对已上传的表编写查询。

设置和要求

点击“开始实验”按钮前的注意事项

请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。

此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。

为完成此实验,您需要:

  • 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
注意:请使用无痕模式(推荐)或无痕浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。
  • 完成实验的时间 - 请注意,实验开始后无法暂停。
注意:请仅使用学生账号完成本实验。如果您使用其他 Google Cloud 账号,则可能会向该账号收取费用。

如何开始实验并登录 Google Cloud 控制台

  1. 点击开始实验按钮。如果该实验需要付费,系统会打开一个对话框供您选择支付方式。左侧是“实验详细信息”窗格,其中包含以下各项:

    • “打开 Google Cloud 控制台”按钮
    • 剩余时间
    • 进行该实验时必须使用的临时凭据
    • 帮助您逐步完成本实验所需的其他信息(如果需要)
  2. 点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。

    该实验会启动资源并打开另一个标签页,显示“登录”页面。

    提示:将这些标签页安排在不同的窗口中,并排显示。

    注意:如果您看见选择账号对话框,请点击使用其他账号
  3. 如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。

    {{{user_0.username | "<用户名>"}}}

    您也可以在“实验详细信息”窗格中找到“用户名”。

  4. 点击下一步

  5. 复制下面的密码,然后将其粘贴到欢迎对话框中。

    {{{user_0.password | "<密码>"}}}

    您也可以在“实验详细信息”窗格中找到“密码”。

  6. 点击下一步

    重要提示:您必须使用实验提供的凭据。请勿使用您的 Google Cloud 账号凭据。 注意:在本实验中使用您自己的 Google Cloud 账号可能会产生额外费用。
  7. 继续在后续页面中点击以完成相应操作:

    • 接受条款及条件。
    • 由于这是临时账号,请勿添加账号恢复选项或双重验证。
    • 请勿注册免费试用。

片刻之后,系统会在此标签页中打开 Google Cloud 控制台。

注意:如需访问 Google Cloud 产品和服务,请点击导航菜单,或在搜索字段中输入服务或产品的名称。 “导航菜单”图标和“搜索”字段

打开 BigQuery 控制台

  1. 在 Google Cloud 控制台中,选择导航菜单 > BigQuery

您会看到欢迎在 Cloud 控制台中使用 BigQuery 消息框,其中提供了指向快速入门指南和版本说明的链接。

  1. 点击完成

BigQuery 控制台即会打开。

BigQuery 控制台提供用于查询表的界面,其中包括 BigQuery 提供的公共数据集,并提供一种便捷方式向数据集中添加信息。BigQuery 使用表来以结构化方式表示数据。在下一部分,您将详细了解 BigQuery,并学习如何创建自定义表。

任务 1. 创建自定义表

在本部分,您将创建一个数据集。该数据集用于向项目中添加数据。数据集通过视图来帮助控制项目内的数据访问权限。

  1. 在 BigQuery 控制台中,查看探索器部分。
  2. 点击项目 ID 旁的查看操作图标,然后选择创建数据集
突出显示的“创建数据集”选项 注意:数据集包含在特定项目中。数据集是用来组织和控制对表和视图的访问权限的顶层容器。表或视图必须隶属于某个数据集,因此在将数据加载到 BigQuery 之前,您需要至少创建一个数据集。参考:BigQuery 数据集简介
  1. 创建数据集页面中填写以下信息:
字段
数据集 ID soccer
数据位置 us(美国的多个区域)
高级选项 > 默认表到期时间 默认
  1. BigQuery 的创建数据集页面将显示类似以下的信息:
“创建数据集”页面,其中显示了数据集详细信息,并突出显示了“创建数据集”按钮。 注意:目前,公共数据集存储在美国多区域数据位置。为简化操作,请将您的数据集放在同一位置。
  1. 点击面板底部的创建数据集

点击“检查我的进度”,以验证是否完成了以下目标:

检查是否已创建新数据集

在本部分,您使用 BigQuery 创建了一个新数据集。在此过程中,BigQuery 需要明确即将创建的信息应存储在哪个位置。如有需要,BigQuery 还支持启用客户管理的加密。

在下一部分,您将学习如何使用常见的数据格式 JSON(JavaScript 对象表示法)填充创建的数据集。

任务 2. 加载 JSON 数据

现在,您将把之前创建的足球数据表加载到数据集中。
BigQuery 支持多种导入格式。在本实验中,您将用到 JSON 和上一部分创建的数据集。

  1. 在“探索器”部分,点击 soccer 数据集旁边的查看操作图标以创建表。

  2. 选择创建表

在以下步骤中,除非另有说明,否则所有设置均保持默认值。数据存储在公共的 Google Cloud Storage 存储桶中。

  1. 创建表页面上添加以下信息:
字段
基于以下数据源创建表 Google Cloud Storage
从存储桶中选择文件 spls/bq-soccer-analytics/competitions.json
文件格式 JSONL(以换行符分隔的 JSON)
表名称 competitions
架构 在“架构”部分勾选 Auto detect(自动检测)
注意:将 Cloud Storage 存储桶作为 BigQuery 的数据来源时,无需使用 gs:// 前缀。
  1. BigQuery 的创建表界面将显示类似以下的信息:
“创建数据集”界面包含“来源”“目标位置”和“架构”三部分。
  1. 点击创建表
  2. 等待 BigQuery 创建表并加载数据。
  3. 系统会弹出一条通知消息,提示“competitions”已创建
  4. 该表将在数据加载完毕后显示。
  5. 对其他需要导入的 JSON 数据重复上述步骤。
Cloud Storage 存储桶文件 表名称
spls/bq-soccer-analytics/matches.json matches
spls/bq-soccer-analytics/teams.json teams
spls/bq-soccer-analytics/players.json players
spls/bq-soccer-analytics/events.json events
注意:请务必使用文中所示的 Cloud Storage 存储桶文件和表名称。
  1. 表创建完毕后,界面将显示的内容大致如下:
“探索器”菜单中 soccer 数据集下列出的表

点击“检查我的进度”,以验证是否完成了以下目标:检查是否创建了 competitions 表

在本部分,您使用 BigQuery 创建了新表。在此过程中,BigQuery 使用 Cloud Storage 作为 JSON 文件的来源。Cloud Storage 为对象文件提供了一个理想的中间存储选项。

在下一部分,您将学习如何使用另一种常见的数据格式 CSV(逗号分隔值)文件填充创建的数据集。

任务 3. 加载 CSV 数据

在本部分,将另一份足球数据表加载到数据集中。这次的加载来源是一份存储在 Cloud Storage 中的 CSV(逗号分隔值)文件。

  1. 在“探索器”部分,点击 soccer 数据集旁边的查看操作图标,然后选择创建表以创建表。

除非另有说明,否则所有设置均使用默认值。

  1. 创建表页面上添加以下信息:
字段
基于以下数据源创建表 Google Cloud Storage
从存储桶中选择文件 spls/bq-soccer-analytics/tags2name.csv
文件格式 CSV
表名称 tags2name
架构 勾选“自动检测”复选框
  1. BigQuery 的创建表界面将显示类似以下的信息:
“创建数据集”界面包含“来源”“目标位置”和“架构”三部分。
  1. 点击创建表(位于窗口底部)。
  2. 等待 BigQuery 创建表并加载数据。

系统会弹出一条消息,提示“tags2name”已创建。

  1. 该表将在数据加载完毕后显示。

点击“检查我的进度”,以验证是否完成了以下目标:

检查是否已创建 tags2name 表

在本部分,您使用 BigQuery 创建了一个新表。在此过程中,BigQuery 使用 Cloud Storage 作为 CSV 文件的数据来源。Cloud Storage 为对象文件提供了一个理想的中间存储选项。

任务 4. 预览表

  1. 在左侧窗格的导航面板中,依次选择 soccer > competitions
  2. 在详细信息面板中,点击预览标签页。
“competitions”表的预览
  1. 在导航面板中依次点击其他已上传的表。
  2. 查看架构详细信息预览沿袭数据分析数据质量标签页,详细了解每个表中的数据。

BigQuery 能以便捷的方式存储原本采用多种格式保存的数据。如需详细了解 BigQuery 的数据注入方法,请参阅选择数据注入方法

在接下来的几个部分中,您将学习如何查询在 BigQuery 中创建的数据集。

任务 5. 查询“players”数据

现在,您已将数据加载到表中,可以开始对表运行查询了。接下来,创建一个查询,从“players”表中检索身高最高的前 10 位后卫(仅包含有身高数据的记录)。

  1. 在查询编辑器中,点击“+”(SQL 查询)图标。
  2. 复制以下查询并将其粘贴到查询编辑器中:
SELECT (firstName || ' ' || lastName) AS player, birthArea.name AS birthArea, height FROM `soccer.players` WHERE role.name = 'Defender' ORDER BY height DESC LIMIT 5 注意:在上述查询中,您使用 BigQuery 检索足球球员的相关信息。通过对特定球员角色(如后卫)进行查询,可以了解该角色的一般特征。
  1. 点击运行。查询结果会显示在查询窗口下方。
“结果”标签页中的查询结果。

点击“检查我的进度”,以验证是否完成了以下目标:

检查查询是否已运行

了解如何在 BigQuery 中执行查询至关重要。在 BigQuery 中运行查询,可通过一个简洁的界面提取有价值的数据洞见。

任务 6. 查询“events”数据

创建查询,以检索 events 表中所有事件类型的计数。

  1. 复制以下查询并将其粘贴到查询编辑器中:
SELECT eventId, eventName, COUNT(id) AS numEvents FROM `soccer.events` GROUP BY eventId, eventName ORDER BY numEvents DESC
  1. 点击运行。查询结果会显示在查询窗口下方。
查询结果 注意:在上述查询中,您使用 BigQuery 来检索足球比赛中发生的各类事件信息。具体查询传球和射门等事件的出现频率。

点击“检查我的进度”,以验证是否完成了以下目标:

检查查询是否已运行

能够利用存储的数据识别趋势与模式,可为最终用户创造实质性的价值。在下一部分,您将通过测验来检验自己对本 BigQuery 简介内容的掌握情况。

任务 7. 随堂测验

通过完成关于本实验所涵盖主题的简短测验,检验您对 BigQuery 的掌握情况。

恭喜!

您已成功将存储在 Cloud Storage 中的文件上传到 BigQuery 表中,同时掌握了如何编写查询以从表中提取数据。

Google Cloud 培训和认证

…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。

上次更新手册的时间:2025 年 11 月 24 日

本实验的最后测试时间:2025 年 7 月 29 日

版权所有 2026 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

Using an Incognito or private browser window is the best way to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.