实验设置说明和要求
保护您的账号和进度。请务必在无痕浏览器窗口中,使用实验凭证运行此实验。

將資料載入 BigQuery

实验 1 小时 30 分钟 universal_currency_alt 5 积分 show_chart 入门级
info 此实验可能会提供 AI 工具来支持您学习。
此内容尚未针对移动设备进行优化。
为获得最佳体验,请在桌面设备上访问通过电子邮件发送的链接。

總覽

BigQuery 是 Google 提供的全代管 NoOps 數據分析資料庫,價格相當實惠。您可以使用 BigQuery 查詢 TB 規模的資料,不必管理基礎架構,也不需要資料庫管理員。BigQuery 使用 SQL,並且採用「即付即用」模式。這項服務可讓您專心分析資料,找出有意義的深入分析結果。

在這個實驗室中,您會將紐約市計程車載客資料子集擷取至 BigQuery 內的資料表。

課程內容

  • 將多個來源的資料載入 BigQuery
  • 使用 CLI 和控制台將資料載入 BigQuery
  • 使用 DDL 建立資料表

設定

在每個研究室中,您都能在固定時間內免付費建立新的 Google Cloud 專案,並使用一組資源。

  1. 請透過無痕式視窗登入 Qwiklabs。

  2. 請記下研究室的存取時間 (例如 1:15:00),並確保自己能在時間限制內完成作業。
    研究室不提供暫停功能。如有需要,您可以重新開始,但原先的進度恕無法保留。

  3. 準備就緒後,請按一下「Start lab」

  4. 請記下研究室憑證 (使用者名稱密碼),這組資訊將用於登入 Google Cloud 控制台。

  5. 按一下「Open Google Console」

  6. 按一下「Use another account」,然後複製這個研究室的憑證,並貼入提示訊息。
    如果使用其他憑證,系統會顯示錯誤或向您收取費用

  7. 接受條款,然後略過資源復原頁面。

開啟 BigQuery 控制台

  1. 在 Google Cloud 控制台中,依序選取「導覽選單」>「BigQuery」

接著,畫面中會顯示「歡迎使用 Cloud 控制台中的 BigQuery」訊息方塊,當中會列出快速入門指南的連結和使用者介面更新內容。

  1. 按一下「完成」

工作 1:建立新的資料集來儲存資料表

  1. 點選專案 ID 旁邊的「查看動作」(直向三點圖示),然後選取「建立資料集」

  2. 將資料集 ID 命名為 nyctaxi,所有其他選項保留預設值,然後點選「建立資料集」

接著,專案名稱下方會顯示 nyctaxi 資料集。

點選「Check my progress」,確認目標已達成。 建立資料集來儲存資料表

工作 2:從 CSV 檔案擷取新資料集

在本節中,您會將本機 CSV 檔案載入至 BigQuery 資料表。

  1. 點選這個連結,將紐約市計程車 2018 年載客資料的子集下載到電腦。

  2. 前往 BigQuery 控制台,在資料集 ID 方塊輸入「nyctaxi」,然後點選「建立資料表」

指定下列資料表選項

來源

  • 建立資料表來源:上傳
  • 選擇檔案:選擇您先前下載到本機的檔案
  • 檔案格式:CSV

目的地

  • 資料表名稱:2018trips 所有其他設定保留預設值。

結構定義

  • 勾選「自動偵測」 (提示:如果沒看到核取方塊,請確認檔案格式是 CSV 而非 Avro)

進階選項

  • 保留預設值

點選「建立資料表」

  1. 接著,nyctaxi 資料集下方應會顯示 2018trips 資料表。

選擇 2018trips 資料表並查看詳細資料

  1. 選擇「預覽」並確認所有資料欄都已載入,範例如下:

您已成功將 CSV 檔案載入至新的 BigQuery 資料表。

執行 SQL 查詢

接著在 2018trips 資料表練習基本查詢。

  1. 在查詢編輯器中編寫查詢,列出該年度前 5 趟最貴的車程:
#standardSQL SELECT * FROM nyctaxi.2018trips ORDER BY fare_amount DESC LIMIT 5

點選「Check my progress」,確認目標已達成。 從 CSV 檔案擷取新資料集

工作 3:從 Google Cloud Storage 擷取新資料集

現在要嘗試從 Cloud Storage 載入同一份 2018 年載客資料的另一個子集。這次會使用 CLI 工具。

  1. 在 Cloud Shell 執行下列指令:
bq load \ --source_format=CSV \ --autodetect \ --noreplace \ nyctaxi.2018trips \ gs://cloud-training/OCBL013/nyc_tlc_yellow_trips_2018_subset_2.csv 注意:透過上述載入工作,您指定將此子集附加至先前建立的 2018trips 資料表。
  1. 載入工作完成後,畫面上會顯示確認訊息。

  2. 回到 BigQuery 控制台,選擇 2018trips 資料表並查看詳細資料,確認資料列數量增加了約一倍。

  3. 建議您執行先前的查詢,看看前 5 趟最貴的車程是否有變化。

點選「Check my progress」,確認目標已達成。 從 Google Cloud Storage 擷取資料集

工作 4:使用 DDL 從其他資料表建立資料表

2018trips 資料表現在包含整年的載客資料。如果您只對 1 月的資料有興趣,該如何操作呢?為了達成本實驗室的目標,我們在此只會關注載客日期和時間,比較簡單。請使用 DDL 擷取這份資料,並存入另一個資料表

  1. 在查詢編輯器中,執行下列 CREATE TABLE 指令:
#standardSQL CREATE TABLE nyctaxi.january_trips AS SELECT * FROM nyctaxi.2018trips WHERE EXTRACT(Month FROM pickup_datetime)=1;
  1. 接著在查詢編輯器執行下列查詢,找出 1 月內最遠的車程:
#standardSQL SELECT * FROM nyctaxi.january_trips ORDER BY trip_distance DESC LIMIT 1

點選「Check my progress」,確認目標已達成。 使用 DDL 從其他資料表建立資料表

恭喜!

您已成功建立新資料集,並從 CSV 檔案、Google Cloud Storage 和其他 BigQuery 資料表擷取資料至 BigQuery。

關閉研究室

如果您已完成研究室,請按一下「End Lab」(關閉研究室)。Google Cloud Skills Boost 會移除您使用的資源,並清除所用帳戶。

您可以針對研究室的使用體驗評分。請選取合適的星級評等並提供意見,然後按一下「Submit」(提交)

星級評等代表您的滿意程度:

  • 1 星 = 非常不滿意
  • 2 星 = 不滿意
  • 3 星 = 普通
  • 4 星 = 滿意
  • 5 星 = 非常滿意

如果不想提供意見回饋,您可以直接關閉對話方塊。

如有任何想法、建議或指教,請透過「Support」(支援) 分頁提交。

使用手冊上次更新日期:2022 年 7 月 27 日

實驗室上次測試日期:2022 年 7 月 15 日

Copyright 2026 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

使用无痕模式或无痕浏览器窗口是运行此实验的最佳方式。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。