Creating a dataset to store new tables

Check my progress

/ 10

Ingest a new Dataset from a CSV

Check my progress

/ 10

Ingest a dataset from google cloud storage

Check my progress

/ 10

Create tables from other tables with DDL

Check my progress

/ 10

This lab may incorporate AI tools to support your learning.

總覽

BigQuery 是 Google 提供的全代管 NoOps 數據分析資料庫,價格相當實惠。您可以使用 BigQuery 查詢 TB 規模的資料,不必管理基礎架構,也不需要資料庫管理員。BigQuery 使用 SQL,並且採用「即付即用」模式。這項服務可讓您專心分析資料,找出有意義的深入分析結果。

在這個實驗室中,您會將紐約市計程車載客資料子集擷取至 BigQuery 內的資料表。

課程內容

  • 將多個來源的資料載入 BigQuery
  • 使用 CLI 和控制台將資料載入 BigQuery
  • 使用 DDL 建立資料表

設定

在每個研究室中,您都能在固定時間內免付費建立新的 Google Cloud 專案,並使用一組資源。

  1. 請透過無痕式視窗登入 Qwiklabs。

  2. 請記下研究室的存取時間 (例如 1:15:00),並確保自己能在時間限制內完成作業。
    研究室不提供暫停功能。如有需要,您可以重新開始,但原先的進度恕無法保留。

  3. 準備就緒後,請按一下「Start lab」

  4. 請記下研究室憑證 (使用者名稱密碼),這組資訊將用於登入 Google Cloud 控制台。

  5. 按一下「Open Google Console」

  6. 按一下「Use another account」,然後複製這個研究室的憑證,並貼入提示訊息。
    如果使用其他憑證,系統會顯示錯誤或向您收取費用

  7. 接受條款,然後略過資源復原頁面。

開啟 BigQuery 控制台

  1. 在 Google Cloud 控制台中,依序選取「導覽選單」>「BigQuery」

接著,畫面中會顯示「歡迎使用 Cloud 控制台中的 BigQuery」訊息方塊,當中會列出快速入門指南的連結和使用者介面更新內容。

  1. 按一下「完成」

工作 1:建立新的資料集來儲存資料表

  1. 點選專案 ID 旁邊的「查看動作」(直向三點圖示),然後選取「建立資料集」

  2. 將資料集 ID 命名為 nyctaxi,所有其他選項保留預設值,然後點選「建立資料集」

接著,專案名稱下方會顯示 nyctaxi 資料集。

點選「Check my progress」,確認目標已達成。 建立資料集來儲存資料表

工作 2:從 CSV 檔案擷取新資料集

在本節中,您會將本機 CSV 檔案載入至 BigQuery 資料表。

  1. 點選這個連結,將紐約市計程車 2018 年載客資料的子集下載到電腦。

  2. 前往 BigQuery 控制台,在資料集 ID 方塊輸入「nyctaxi」,然後點選「建立資料表」

指定下列資料表選項

來源

  • 建立資料表來源:上傳
  • 選擇檔案:選擇您先前下載到本機的檔案
  • 檔案格式:CSV

目的地

  • 資料表名稱:2018trips 所有其他設定保留預設值。

結構定義

  • 勾選「自動偵測」 (提示:如果沒看到核取方塊,請確認檔案格式是 CSV 而非 Avro)

進階選項

  • 保留預設值

點選「建立資料表」

  1. 接著,nyctaxi 資料集下方應會顯示 2018trips 資料表。

選擇 2018trips 資料表並查看詳細資料

  1. 選擇「預覽」並確認所有資料欄都已載入,範例如下:

您已成功將 CSV 檔案載入至新的 BigQuery 資料表。

執行 SQL 查詢

接著在 2018trips 資料表練習基本查詢。

  1. 在查詢編輯器中編寫查詢,列出該年度前 5 趟最貴的車程:
#standardSQL SELECT * FROM nyctaxi.2018trips ORDER BY fare_amount DESC LIMIT 5

點選「Check my progress」,確認目標已達成。 從 CSV 檔案擷取新資料集

工作 3:從 Google Cloud Storage 擷取新資料集

現在要嘗試從 Cloud Storage 載入同一份 2018 年載客資料的另一個子集。這次會使用 CLI 工具。

  1. 在 Cloud Shell 執行下列指令:
bq load \ --source_format=CSV \ --autodetect \ --noreplace \ nyctaxi.2018trips \ gs://cloud-training/OCBL013/nyc_tlc_yellow_trips_2018_subset_2.csv 注意:透過上述載入工作,您指定將此子集附加至先前建立的 2018trips 資料表。
  1. 載入工作完成後,畫面上會顯示確認訊息。

  2. 回到 BigQuery 控制台,選擇 2018trips 資料表並查看詳細資料,確認資料列數量增加了約一倍。

  3. 建議您執行先前的查詢,看看前 5 趟最貴的車程是否有變化。

點選「Check my progress」,確認目標已達成。 從 Google Cloud Storage 擷取資料集

工作 4:使用 DDL 從其他資料表建立資料表

2018trips 資料表現在包含整年的載客資料。如果您只對 1 月的資料有興趣,該如何操作呢?為了達成本實驗室的目標,我們在此只會關注載客日期和時間,比較簡單。請使用 DDL 擷取這份資料,並存入另一個資料表

  1. 在查詢編輯器中,執行下列 CREATE TABLE 指令:
#standardSQL CREATE TABLE nyctaxi.january_trips AS SELECT * FROM nyctaxi.2018trips WHERE EXTRACT(Month FROM pickup_datetime)=1;
  1. 接著在查詢編輯器執行下列查詢,找出 1 月內最遠的車程:
#standardSQL SELECT * FROM nyctaxi.january_trips ORDER BY trip_distance DESC LIMIT 1

點選「Check my progress」,確認目標已達成。 使用 DDL 從其他資料表建立資料表

恭喜!

您已成功建立新資料集,並從 CSV 檔案、Google Cloud Storage 和其他 BigQuery 資料表擷取資料至 BigQuery。

關閉研究室

如果您已完成研究室,請按一下「End Lab」(關閉研究室)。Google Cloud Skills Boost 會移除您使用的資源,並清除所用帳戶。

您可以針對研究室的使用體驗評分。請選取合適的星級評等並提供意見,然後按一下「Submit」(提交)

星級評等代表您的滿意程度:

  • 1 星 = 非常不滿意
  • 2 星 = 不滿意
  • 3 星 = 普通
  • 4 星 = 滿意
  • 5 星 = 非常滿意

如果不想提供意見回饋,您可以直接關閉對話方塊。

如有任何想法、建議或指教,請透過「Support」(支援) 分頁提交。

使用手冊上次更新日期:2022 年 7 月 27 日

實驗室上次測試日期:2022 年 7 月 15 日

Copyright 2026 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。

Before you begin

  1. Labs create a Google Cloud project and resources for a fixed time
  2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
  3. On the top left of your screen, click Start lab to begin

Use private browsing

  1. Copy the provided Username and Password for the lab
  2. Click Open console in private mode

Sign in to the Console

  1. Sign in using your lab credentials. Using other credentials might cause errors or incur charges.
  2. Accept the terms, and skip the recovery resource page
  3. Don't click End lab unless you've finished the lab or want to restart it, as it will clear your work and remove the project

This content is not currently available

We will notify you via email when it becomes available

Great!

We will contact you via email if it becomes available

One lab at a time

Confirm to end all existing labs and start this one

Use private browsing to run the lab

Using an Incognito or private browser window is the best way to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.

Complete this quick step to start your lab.