准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
Dataflow API
/ 10
Create a cloud Bigtable instance
/ 15
Create new cloud Bigtable table
/ 15
Load data files from cloud storage using a dataflow template
/ 30
Delete a Bigtable table and instance
/ 10
Bigtable 是 Google 的全托管式可扩缩 NoSQL 数据库服务。Bigtable 非常适合将大量数据存储在键值对存储区中,并适合个性化、广告技术、金融技术、数字媒体和物联网 (IoT) 等应用场景。Bigtable 支持以低延迟方式实现高读写吞吐量,以便快速访问大量数据并进行处理和分析。
对于个性化用例,Bigtable 既可以处理高写入量,以存储用户与在线商品的互动,也可以处理高读取量,以将这些互动提供给生成个性化推荐的模型。
在本实验中,您将使用 Google Cloud 控制台创建一个 Bigtable 实例,其中包含一个用于存储用户与产品互动情况的表。然后,您使用 Dataflow 模板用 Cloud Storage 上预先生成的数据文件来填充该表。Dataflow 作业完成后,您需要验证该表已成功填充数据,然后删除 Bigtable 数据,完成实验。
在本实验中,您将学习如何创建 Bigtable 实例,以及如何在不编写任何代码的情况下从 Cloud Storage 加载数据。
请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。
此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。
为完成此实验,您需要:
点击开始实验按钮。如果该实验需要付费,系统会打开一个对话框供您选择支付方式。左侧是“实验详细信息”窗格,其中包含以下各项:
点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。
该实验会启动资源并打开另一个标签页,显示“登录”页面。
提示:将这些标签页安排在不同的窗口中,并排显示。
如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。
您也可以在“实验详细信息”窗格中找到“用户名”。
点击下一步。
复制下面的密码,然后将其粘贴到欢迎对话框中。
您也可以在“实验详细信息”窗格中找到“密码”。
点击下一步。
继续在后续页面中点击以完成相应操作:
片刻之后,系统会在此标签页中打开 Google Cloud 控制台。
Cloud Shell 是一种装有开发者工具的虚拟机。它提供了一个永久性的 5GB 主目录,并且在 Google Cloud 上运行。Cloud Shell 提供可用于访问您的 Google Cloud 资源的命令行工具。
点击 Google Cloud 控制台顶部的激活 Cloud Shell 。
在弹出的窗口中执行以下操作:
如果您连接成功,即表示您已通过身份验证,且项目 ID 会被设为您的 Project_ID
gcloud 是 Google Cloud 的命令行工具。它已预先安装在 Cloud Shell 上,且支持 Tab 自动补全功能。
输出:
输出:
gcloud 的完整文档,请参阅 gcloud CLI 概览指南。
为确保可以访问所需的 API,重新启动与 Dataflow API 的连接。
点击检查我的进度,验证已完成以下目标:
若要在 Bigtable 中创建新表,您首先需要创建一个 Bigtable 实例来存储该表。
在 Google Cloud 控制台的导航菜单 () 中,点击数据库下的 Bigtable。
点击创建实例。
输入所需信息以创建 Bigtable 实例:
| 属性 | 值 |
|---|---|
| 实例名称 | 个性化销售 |
| 实例 ID | 保留默认值。 |
| 存储空间类型 | SSD |
| 集群 ID | 保留默认值。 |
| 区域 | |
| 可用区 | |
| 节点扩缩模式 | 手动分配 |
| 数量 | 保留默认值。 |
点击检查我的进度,验证已完成以下目标:
在 Bigtable 中,表中的每一行都有一个称为行键的唯一标识符,表中的列按列族分组,以组织相关列。在此任务中,您将创建一个新的 Bigtable 表,其中包含适合用户互动的行键和列族。
首先,您创建一个名为 UserSessions 的表,用于存储用户与各种产品的在线互动和已确认的销售情况,并使用用户 ID 与时间戳的组合作为行键。然后,您创建两个列族 Interactions 和 Sales,以帮助整理相关列。
在 Bigtable 实例列表中,点击名为 personalized-sales 的实例 ID。
在导航菜单中,点击实例下的表。
点击创建表。
对于表 ID,输入 UserSessions
点击添加列族 (Add column family)。
对于列族名称,输入 Interactions
保留垃圾回收政策的默认值。
点击完成。
重复第 5 步到第 7 步,创建另一个名为 Sales 的列族。
点击创建。
点击检查我的进度,验证已完成以下目标:
在此任务中,您将运行 Dataflow 作业,以将数据从 Cloud Storage 加载到 Bigtable。为了成功运行 Dataflow 作业,您首先必须创建一个 Cloud Storage 存储桶,供 Dataflow 根据需要写入临时文件。然后,您就可以成功地通过模板创建并运行新的 Dataflow 作业。
在 Google Cloud 控制台的导航菜单 () 中,依次点击 Cloud 概览 > 信息中心。
在项目信息下,复制项目 ID 的值(例如
您将使用 Qwiklabs 项目 ID 作为 Cloud Storage 存储桶名称,该 ID 在全局范围内是唯一的。
在 Google Cloud 控制台的导航菜单 () 中,依次点击 Cloud Storage > 存储桶。
点击创建存储桶。
输入所需信息以创建 Cloud Storage 存储桶,并将 project-id 替换为在第 2 步中复制的项目 ID。
| 属性 | 值 |
|---|---|
| 名称 | project-id |
| 位置类型 | 多区域 |
| 位置 | us(美国的多个区域) |
保留其余字段的默认值。
点击创建。
如果出现系统将禁止公开访问的提示,点击确认。
在 Google Cloud 控制台的导航菜单 () 中,点击分析下的 Dataflow > 作业。
点击基于模板创建作业。
输入所需信息,以从模板创建 Dataflow 作业,并将 project-id 替换为您之前复制的项目 ID。
| 属性 | 值 |
|---|---|
| 作业名称 | import-usersessions |
| 区域端点 | |
| Dataflow 模板 | Cloud Storage 上的 SequenceFile 文件到 Cloud Bigtable |
| 项目 ID | project-id |
| 实例 ID | personalized-sales |
| 表 ID | UserSessions |
| 源路径模式 | gs://spls/gsp1054/retail-interactions-sales-00000-of-00001 |
| 临时位置 | gs://project-id/temp |
保留其余字段的默认值。
点击运行作业。
在作业图页面上,在作业步骤视图下,选择图表视图。
图表视图会显示一个图表,其中展示了作业如何逐步完成以下步骤:
作业成功完成后,作业图中的每个任务旁边都会显示一个绿色对勾标记,表示状态为“成功”。此作业大约需要 3 到 5 分钟才能成功运行。
点击检查我的进度,验证已完成以下目标:
Dataflow 作业成功完成后,您可以使用 cbt(Cloud Bigtable 命令行工具)命令连接到 Bigtable 实例,并验证表中已填充数据。
如需使用 cbt CLI 命令连接到 Bigtable,您首先需要使用 Cloud Shell 来更新 .cbtrc 配置文件,将项目 ID 和 Bigtable 实例 ID 添加到其中。
如需回顾如何访问 Cloud Shell,点击本页面右侧菜单中的设置和要求。
.cbtrc 文件,在 Cloud Shell 中运行以下命令:.cbtrc 文件,运行以下命令:输出应类似于以下内容:
在 Cloud Shell 中配置 .cbtrc 配置文件后,您可以运行简单的 cbt CLI 命令来查询表的前十条记录。
输出结构如下:
输出值将如下所示:
在 Google Cloud 控制台的导航菜单 () 中,点击数据库下的 Bigtable。
在 Bigtable 实例列表中,点击名为 personalized-sales 的实例 ID。
在导航菜单中,点击实例下的表。
点击名为 UserSessions 的表。
点击删除表。
在确认对话框中,输入 UserSessions
点击删除。
在导航菜单的实例下,点击概览。
点击删除实例。
在确认对话框中,输入 personalized-sales
点击删除。
点击检查我的进度,验证已完成以下目标:
在本实验中,您使用 Bigtable 创建了新实例和表,使用 Dataflow 模板将数据加载到表中,并通过运行简单的 cbt CLI 命令确认数据已成功加载。最后,您删除了 Bigtable 表和实例,完成了本实验。
…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。
上次更新手册的时间:2025 年 8 月 13 日
上次测试实验的时间:2025 年 8 月 13 日
版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验