arrow_back

使用 Gemini in BigQuery 探索数据

登录 加入
访问 700 多个实验和课程

使用 Gemini in BigQuery 探索数据

实验 1 小时 30 分钟 universal_currency_alt 1 个积分 show_chart 入门级
info 此实验可能会提供 AI 工具来支持您学习。
访问 700 多个实验和课程

GSP1257

Google Cloud 自学实验的徽标

概述

想象一下,您是一名侦探,正在试图解开一个谜团,但摆在您面前的不是线索,而是成堆包含海量数据的电子表格。

您是 Data Beans 公司的新任数据分析师,这家公司专门为全国各地的移动咖啡车公司提供数据收集、分析和洞察服务。这是您入职的第一周,您的任务是探索与咖啡车、菜单和订单相关的数据。负责为您提供入职培训的前辈建议您用 BigQuery 中的表探索器和数据分析功能来理解这些数据并从中获取分析洞见。这些功能可以帮助您轻松上手探索公司的数据并从中获取洞见,而无需从头编写 SQL 查询。

目标

在本实验中,您将学习如何完成以下操作:

  • 生成针对 order_item 表的数据分析。
  • 对 location 表使用表探索器并生成基本查询。
  • 在不编写 SQL 代码的情况下对 order_item 表运行查询。

完成这些目标后,您还将在开放式任务中使用上述任一功能来分析 menu 表和 order 表。

最后,本实验还留出了一些时间来让您回答实验日志中的问题,以便您回顾在本实验中学到的内容,思考如何将表探索器和数据分析功能应用于您自己的应用场景。

设置和要求

点击“开始实验”按钮前的注意事项

请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。

此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。

为完成此实验,您需要:

  • 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
注意:请使用无痕模式(推荐)或无痕浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。
  • 完成实验的时间 - 请注意,实验开始后无法暂停。
注意:请仅使用学生账号完成本实验。如果您使用其他 Google Cloud 账号,则可能会向该账号收取费用。

如何开始实验并登录 Google Cloud 控制台

  1. 点击开始实验按钮。如果该实验需要付费,系统会打开一个对话框供您选择支付方式。左侧是“实验详细信息”窗格,其中包含以下各项:

    • “打开 Google Cloud 控制台”按钮
    • 剩余时间
    • 进行该实验时必须使用的临时凭据
    • 帮助您逐步完成本实验所需的其他信息(如果需要)
  2. 点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。

    该实验会启动资源并打开另一个标签页,显示“登录”页面。

    提示:将这些标签页安排在不同的窗口中,并排显示。

    注意:如果您看见选择账号对话框,请点击使用其他账号
  3. 如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。

    {{{user_0.username | "<用户名>"}}}

    您也可以在“实验详细信息”窗格中找到“用户名”。

  4. 点击下一步

  5. 复制下面的密码,然后将其粘贴到欢迎对话框中。

    {{{user_0.password | "<密码>"}}}

    您也可以在“实验详细信息”窗格中找到“密码”。

  6. 点击下一步

    重要提示:您必须使用实验提供的凭据。请勿使用您的 Google Cloud 账号凭据。 注意:在本实验中使用您自己的 Google Cloud 账号可能会产生额外费用。
  7. 继续在后续页面中点击以完成相应操作:

    • 接受条款及条件。
    • 由于这是临时账号,请勿添加账号恢复选项或双重验证。
    • 请勿注册免费试用。

片刻之后,系统会在此标签页中打开 Google Cloud 控制台。

注意:如需访问 Google Cloud 产品和服务,请点击导航菜单,或在搜索字段中输入服务或产品的名称。 “导航菜单”图标和“搜索”字段

任务 1.生成针对 order item 表的数据分析

在此任务中,您将对 coffee_on_wheels 数据集中的 order_item 表执行数据分析。

数据分析这项工具适合以下这样的用户:想要探索其数据并获取洞见,但又不想编写复杂的 SQL 查询。

  1. 在 Google Cloud 控制台中,点击导航菜单下的 BigQuery

  2. 在欢迎弹出式窗口中点击完成

  3. 探索器面板中,展开项目。您会在列表底部看到 coffee_on_wheels 数据集。

  4. 展开 coffee_on_wheels 数据集。您将看到 order_item 表。

  5. 点击 order_item 表。order_item 表的架构即会显示。查看架构的详细信息。

  6. 点击数据分析标签页。您将看到一条消息提示“尚未生成数据分析。”这是正常情况,因为您的实验环境中还未生成过数据分析。

  7. 点击生成数据分析按钮。Gemini 现在会为 order_item 表生成数据分析。

    注意:为表生成数据分析需要几分钟的时间,这是正常现象。请等到数据分析生成完毕后,再检查此任务的完成情况。稍后您将返回至 order_item 表的数据分析界面。

点击检查我的进度以验证是否完成了以下目标: 生成针对 order item 表的数据分析。

任务 2. 使用表探索器查看 location 表的详细信息

在等待数据分析生成的这段时间里,您将使用 BigQuery 的表探索器功能查看 coffee_on_wheels 数据集中的 location 表。您还将使用表探索器构建一个基本查询,查找与 Coffee Cart Connection、Empire Espresso 和 Street Sips 咖啡车相关的所有字段。

访问表探索器

  1. 探索器面板中,点击 location 表。location 表的架构即会显示。查看架构的详细信息。

  2. 点击表探索器标签页。请注意 BigQuery Studio 页面的变化,其中“不同的值”部分位于页面上方,而“生成的查询”部分位于页面下方,生成的查询如下:

    SELECT * FROM `{{{project_0.project_id|set at lab start}}}.coffee_on_wheels.location`;

    您将在“不同的值”部分操作。当您使用选择字段按钮添加字段时,您将看到在“生成的查询”部分,查询出现了变化。

选择字段并构建基本查询

  1. 点击选择字段。表中的所有字段即会显示。

  2. 选择所有字段并点击保存。现在,您可以看到每个字段的交互式卡片。交互式卡片显示了数据集中每个字段最常见的值。每个卡片中的值都可以用来修改查询。但是,在 SQL 语句中只能使用一个卡片作为过滤条件(Where 子句)。

  3. 您将使用 location_name 卡片创建一个新查询。点击:

    • Coffee Cart Connection
    • Street Sips
    • Empire Espresso Explorer
    注意:一旦选择了这些值,BigQuery 将显示“此脚本在运行时将处理 5.7 KB 的数据。”这表示在运行查询时,脚本将处理多少数据。

    请注意,该查询为:

    SELECT `city_id`, `company_id`, `location_id`, `location_name`, `location_type` FROM `{{{project_0.project_id|set at lab start}}}.coffee_on_wheels.location` WHERE (`location_name` IN ('Coffee Cart Connection', 'Empire Espresso Explorer', 'Street Sips'));
  4. 点击应用。请注意其他卡片中的其他值如何变化。

  5. 点击复制到查询

  6. BigQuery Studio 中将打开新的未命名的查询标签页。

  7. 点击运行。结果将分 3 行显示这些咖啡车的 city_idcompany_idlocation_idlocation_namelocation_type

    恭喜!您刚刚利用表探索器编写了第一个查询,却未使用任何 SQL 代码。

总之,表探索器是一个帮助您在 BigQuery 中进行数据探索的入门工具,特别适合 SQL 新手或需要快速了解数据的用户。

以下是一些关于表探索器的重要注意事项:

  • 它是一种直观显示工具,一次探索一个表。
  • 它不支持跨多个表的复杂操作,例如联接。
  • 它生成的是基本的 SQL 查询。例如,您无法创建包含 AND 或 OR 等运算符的复杂 WHERE 子句。
  • 它不为复杂查询提供依托 AI 技术的辅助功能。

思考与总结

  1. 思考一下,基于您的数据和 BigQuery 的应用场景,您会如何利用表探索器功能?

点击检查我的进度以验证是否完成了以下目标: 使用表探索器查看 location 表的详细信息。

任务 3.在不编写代码的情况下对 order_item 表运行查询

您在前面的任务中生成的数据分析现已可供使用。在此任务中,您将使用基于这些数据分析生成的提示,在不编写代码的情况下对 order_item 表运行查询。

选择一条数据分析并运行与其相关的查询

  1. 探索器面板中,点击 order_item 表。查看架构和关联字段。

  2. 点击数据分析。请注意,您已在之前的任务中生成了数据分析,因此现在应该能在此处看到这些数据分析。

    注意:每条数据分析都以 who、what、when、where 或 how 开头的问句形式呈现,或者以 calculate、identify 或 find 之类的动词开头。
  3. 查看列出的数据分析,并找出与下面类似的一条:

    What is the total revenue generated from each menu item? 注意:该数据分析也可能通过以下这样的措辞生成:“This query calculates the total revenue generated by each menu item.” 注意:这些数据分析由 Gemini 生成,因此,您看到的数据分析可能与上述语句不完全一样。原因在于 Gemini 是基于数据集和经训练模型中的数据来预测数据分析的。鉴于此,您需要找到包含如下内容的类似语句:“the total revenue for each menu item in the order_item table”。如果您想使用示例给出的提示,您可以随时点击“生成数据分析”按钮来重新生成数据分析
  4. 找到类似的数据分析后,请展开该数据分析以显示其基础 SQL 代码。您将看到一条查询,类似于以下内容:

    SELECT menu_id, SUM(item_total) AS total_revenue FROM `coffee_on_wheels.order_item` GROUP BY menu_id;
  5. 点击复制到查询。BigQuery Studio 中将打开一个新的标签页,也就是“未命名的查询”标签页,其中包含了问题(用于生成查询的提示)和查询。

  6. 点击运行。查询即会运行并会显示结果。请注意,结果包含两个字段:菜单 ID 和计算出的每个菜单单品的总收入。这些结果很有帮助,但我们无法迅速知道哪个单品的收入最高,而且总收入字段包含了过多的小数位。您仍然可以在不编写 SQL 代码的情况下解决此问题。

在不编写 SQL 代码的情况下转换查询,使结果仅包含两个小数位

  1. 选中该查询。

  2. 在 SELECT 语句的左侧,点击 Gemini,然后点击转换。您将看到一个包含空文本字段和生成按钮的对话框。在此对话框中,您可以基于自然语言转换查询。

  3. 输入以下提示:

    Display total_revenue as 2 decimal points.
  4. 点击生成。您将看到原始查询以红色背景文本显示,修改后的查询以绿色背景文本显示。

  5. 如果您同意使用新建议的查询,请点击插入。新查询将被插入到“未命名的查询”标签页中,应该如下所示:

    -- What is the total revenue generated by each menu item? -- Display total_revenue as 2 decimal points. SELECT menu_id, ROUND(SUM(item_total), 2) AS total_revenue FROM `{{{project_0.project_id|set at lab start}}}.coffee_on_wheels.order_item` GROUP BY 1;
  6. 点击运行。请注意,现在 total_revenue 字段的格式已设置为仅包含两位小数。

转换查询以按降序对结果排序

  1. 选中该查询。

  2. 在 SELECT 语句的左侧,点击 Gemini,然后点击转换

  3. 输入以下提示:

    Order the total_revenue field in descending order.
  4. 点击生成。您将看到原始查询以红色背景文本显示,修改后的查询以绿色背景文本显示。

  5. 如果您同意使用新建议的查询,请点击插入。新查询将被插入到“未命名的查询”标签页中,应该如下所示:

    -- What is the total revenue generated from each menu item? -- Display total_revenue as 2 decimal points. -- Order the total_revenue field in descending order. SELECT menu_id, ROUND(SUM(item_total), 2) AS total_revenue FROM `{{{project_0.project_id|set at lab start}}}.coffee_on_wheels.order_item` GROUP BY menu_id ORDER BY total_revenue DESC;
  6. 点击运行。请注意,现在 total_revenue 字段按降序排列,总收入最高的菜单单品显示在最前面。

恭喜!您借助数据分析功能在不编写 SQL 代码的情况下成功选择了一条数据分析,并对查询进行了转换。

总而言之,BigQuery 数据分析这项工具适合以下这样的用户:想要探索其数据并获取洞见,但又不想编写复杂的 SQL 查询。

以下是一些关于 BigQuery 数据分析功能的重要注意事项:

  • 它是一项帮助探索和了解数据的实用工具,特别适合 SQL 新手或想要开始进行数据分析的用户。
  • 它使用 Gemini 根据您数据的元数据生成查询,让您更轻松地获得相关的数据洞见。
  • 这一功能可助您挖掘数据潜力。

思考与总结

  1. 对于 order_item 表,您认为哪条数据分析最有用?

  2. 思考一下,基于您的数据和 BigQuery 的应用场景,您会如何利用这个数据分析功能?

点击检查我的进度以验证是否完成了以下目标: 在不编写代码的情况下对 order item 表运行查询。

任务 4.查看 menu 表和 order 表

在此任务中,您将探索 coffee_on_wheels 数据集中的 menu 表和 order 表,并使用实验日志回答下面的问题。现在,您已了解数据分析和表探索器工具,我们建议您使用它们来回答这些问题。如果您愿意,也可以自己编写查询,但请注意本实验剩余的时间。当时间剩余 5 分钟时,我们建议您确认已完成所有进度检查,以便完成实验并获得积分。

  1. 找出每种杯型均价最高的前三种单品。

    • 哪个表或哪些表会包含这些信息?
    • 哪个工具可以帮助您找到问题的答案?
  2. 找出来自 location_id 37 的所有订单。

    • 哪个表或哪些表会包含这些信息?
    • 有多少订单来自这一地点?
    • 您会使用哪个工具来找出所有的订单?
  3. 对于您的应用场景,哪个工具(表探索器或数据分析)对您最有用?为什么?

回答完这些问题后,您可以查看实验日志答案

恭喜!

在本实验中,您学习了如何生成数据分析,并在不编写代码的情况下使用这些分析对 coffee_on_wheels 数据集运行查询。您还学习了如何利用表探索器在不编写代码的情况下探索 location 表并生成基本查询。最后,您还思考了如何使用 BigQuery 将这些功能应用到自己的数据和应用场景中。

后续步骤/了解详情

请思考您在本实验中学到的内容以及您为实验日志中的问题给出的答案,并与团队中的其他人分享。您可通过以下链接了解更多信息:

Google Cloud 培训和认证

…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。

本手册的最后更新时间:2024 年 10 月 7 日

本实验的最后测试时间:2024 年 10 月 7 日

版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

请使用无痕模式或无痕式浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。