准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
在本實驗室中,您是紐約市計程車隊的老闆,並希望能即時監控業務狀況。您將建立串流資料 pipeline 來記錄多項資訊,包括計程車收益、乘客數量和行程狀態等,並在管理資訊主頁中以圖表呈現結果。
本實驗室的內容包括:
每個實驗室都會提供新的 Google Cloud 專案和一組資源,讓您在時限內免費使用。
按一下「Start Lab」按鈕。如果研究室會產生費用,畫面中會出現選擇付款方式的彈出式視窗。左側的「Lab Details」窗格會顯示下列項目:
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」。
接著,實驗室會啟動相關資源並開啟另一個分頁,當中顯示「登入」頁面。
提示:您可以在不同的視窗中並排開啟分頁。
如有必要,請將下方的 Username 貼到「登入」對話方塊。
您也可以在「Lab Details」窗格找到 Username。
點選「下一步」。
複製下方的 Password,並貼到「歡迎使用」對話方塊。
您也可以在「Lab Details」窗格找到 Password。
點選「下一步」。
按過後續的所有頁面:
Google Cloud 控制台稍後會在這個分頁開啟。
Google Cloud Shell 是搭載多項開發工具的虛擬機器,提供永久的 5 GB 主目錄,而且在 Google Cloud 中運作。
Google Cloud Shell 提供指令列存取權,方便您使用 Google Cloud 資源。
在 Cloud 控制台的右上方找到工具列,然後按一下「開啟 Cloud Shell」按鈕。
按一下「繼續」。
佈建並連線至環境的作業需要一些時間才能完成。連線建立完成即代表已通過驗證,而且專案已設為您的「PROJECT_ID」。示例如下:
gcloud 是 Google Cloud 的指令列工具,已預先安裝於 Cloud Shell,並支援 Tab 鍵完成功能。
輸出內容:
輸出內容示例:
輸出內容:
輸出內容示例:
在這項工作中,您將建立 taxirides 資料集,建立方法有兩種,可以使用 Google Cloud Shell 或 Google Cloud 控制台。
本實驗室從紐約市計程車暨禮車管理局的公開資料集中,擷取部分內容,並整理成以半形逗號分隔的小型資料檔案,供您模擬定期更新的計程車資料。
BigQuery 是無伺服器的 data warehouse,當中的資料表會整理成資料集。在本實驗室中,您將使用 Dataflow 傳送獨立檔案中的計程車資料,並將這些資料儲存至 BigQuery。完成這項設定後,系統就會自動處理及載入任何匯入來源 Cloud Storage bucket 的新資料檔案。
請使用下列任一種方法建立新的 BigQuery 資料集:
taxirides 資料集。taxirides.realtime 資料表 (稍後會將資料串流至這個空白的結構定義中)。前往 Google Cloud 控制台,依序點按「導覽選單」圖示 和「BigQuery」。
畫面出現「歡迎」對話方塊時,點按「完成」。
點按專案 ID 旁的「查看動作」圖示 ,然後點按「建立資料集」。
在「資料集 ID」部分,輸入「taxirides」。
在「資料位置」部分,選取:
接著點按「建立資料集」。
在「Explorer」窗格中,點按「展開節點」圖示 ,即可看見新建的 taxirides 資料集。
點按 taxirides 資料集旁邊的「查看動作」圖示 ,然後點按「開啟」。
點按「建立資料表」。
在「資料表」部分輸入「realtime」。
在「結構定義」部分點按「以文字形式編輯」,然後貼上下列內容:
在「分區與叢集設定」部分,選取「時間戳記」。
點按「建立資料表」。
在這項工作中,您需要將必要檔案移至專案中。
Cloud Storage 可讓您在世界各地隨時儲存及擷取大小不限的資料。這項服務有多種用途,包括提供網站內容、儲存資料供封存和災難復原之用,或是透過直接下載的方式,將大量資料物件發布給使用者。
系統已在您啟動實驗室時順便建立了 Cloud Storage bucket。
在這項工作中,您會設定串流資料 pipeline,用來讀取 Cloud Storage bucket 中的檔案,並將資料寫入 BigQuery。
Dataflow 是一項可執行資料分析作業的無伺服器服務。
在 Cloud 控制台的導覽選單 (),依序點選「查看所有產品」>「Analytics」>「Dataflow」。
點選頂端選單列中的「依據範本建立工作」。
在 Dataflow 工作的「工作名稱」部分,輸入「streaming-taxi-pipeline」。
在「區域端點」部分,選取:
點選「必要參數」。
在用來寫入暫存檔案的「臨時位置」部分,貼上或輸入下列內容:
在「工作站數量上限」部分,輸入 2。
在「工作站數量」部分,輸入「1」。
取消勾選「使用預設機型」。
在「一般用途」下方,選擇下列選項:
系列:E2
機型:e2-medium (2 個 vCPU,4 GB 記憶體)
新的串流工作已成功啟動!您應該會看見以視覺化方式呈現的資料 pipeline。系統會開始將資料移至 BigQuery,請等待 3 到 5 分鐘。
在這項工作中,您將在串流期間分析資料。
在 Google Cloud 控制台中,依序點按「導覽選單」圖示 和「BigQuery」。
畫面顯示「歡迎」對話方塊時,點按「完成」。
在「查詢編輯器」中輸入下列內容,然後點按「執行」:
輸出內容應如下所示:
在這項工作中,您需要計算匯總後的串流資料以製作報表。
在「查詢編輯器」中,清除目前的查詢內容。
複製及貼上下列查詢,然後點按「執行」。
系統會針對每筆計程車下車資料,傳回按分鐘細分的重要指標。
依序點按「儲存」和「儲存查詢」。
在「儲存查詢」對話方塊的「名稱」欄位,輸入「My Saved Query」。
確認「區域」部分列出的區域與 Qwiklabs 實驗室相符。
點選「儲存」。
在這項工作中,您需要停止 Dataflow 工作,以釋出資源供專案使用。
在 Cloud 控制台的導覽選單 (),依序點選「查看所有產品」>「Analytics」>「Dataflow」。
點選「streaming-taxi-pipeline」或新工作的名稱。
點按「停止」,然後依序選取「取消」和「停止工作」。
在這項工作中,您將建立即時資訊主頁來呈現資料圖表。
在 Google Cloud 控制台中,依序點按「導覽選單」圖示 和「BigQuery」。
在「Explorer」窗格,展開「專案 ID」。
展開「查詢」,然後點選「My Saved Query」。
查詢編輯器會載入該項查詢。
點選「執行」。
在「查詢結果」部分,依序點選「開啟方式」>「Looker Studio」。
Looker Studio 會隨即開啟,這時請點按「開始使用」。
在「Looker Studio」視窗中,點按長條圖。
「圖表」窗格會隨即顯示。
點按「新增圖表」,然後選取「組合圖」。
在「設定」窗格的「Data Range Dimension」部分,將滑鼠游標懸停在「minute (Date)」上,然後點按「X」圖示移除該維度。
在「資料」窗格中點按「dashboard_sort」,然後將其依序拖曳至「設定」>「Data Range Dimension」>「新增維度」。
在「設定」窗格的「維度」部分,點按「分鐘」並選取「dashboard_sort」。
在「設定」窗格的「指標」部分,點按「dashboard_sort」並選取「total_rides」。
在「設定」窗格的「指標」部分,點按「Record Count」並選取「total_passengers」。
在「設定」窗格的「指標」部分,點按「新增指標」並選取「total_revenue」。
在「設定」窗格的「排序」部分,點按「total_rides」並選取「dashboard_sort」。
在「設定」窗格的「排序」部分,點按「遞增」。
產生的圖表應與下方類似:
確定資訊主頁符合需求之後,點選「儲存並分享」來儲存這個資料來源。
系統提示您完成帳戶設定時,請輸入國家/地區和公司詳細資料,並同意條款及細則,然後點選「繼續」。
系統提示您選取想要接收的最新內容時,所有選項都選取「否」,然後點選「繼續」。
如果出現「先查看資料存取權再儲存」提示視窗,請點按「確認並儲存」。
系統提示您選取帳戶時,請選取自己的學生帳戶。
每當有人查看這個資訊主頁時,資料就會根據近期交易更新。您可以依序點按「更多選項」圖示 和「重新整理資料」來試試看。
在這項工作,您會建立時序圖。
點選這個 Looker Studio 連結,在新的瀏覽器分頁開啟 Looker Studio。
在「報表」頁面的「使用範本」部分,點按「[+] 空白報表」範本。
新的空白報表會隨即開啟,並顯示「將資料新增至報表」視窗。
在「Google 連接器」清單中,選取「BigQuery」圖塊。
點按「自訂查詢」並選取所需的專案 ID,ID 格式應如下所示:qwiklabs-gcp-xxxxxxx。
在「輸入自訂查詢」部分貼上下列查詢:
依序點按「新增」和「加入報表」。
新的未命名報表會隨即顯示。畫面最多可能需要一分鐘才會重新整理完畢。
在「資料」窗格中,依序點按「新增欄位」和「新增計算結果欄位」。
點按左側角落的「所有欄位」。
在「時間戳記」欄位中,依序選取「日期和時間」和「西元年月日時分 (YYYYMMDDhhmm)」,變更時間戳記的類型。
在變更時間戳記對話方塊中,依序點按「繼續」和「完成」。
點按頂端選單中的「新增圖表」。
選擇「時序圖」。
將圖表移至畫面左下角的空白處。
在「設定」窗格的「維度」部分,點按「timestamp (Date)」,然後選取「時間戳記」。
在「設定」窗格的「維度」部分,點選「時間戳記」,然後選取「日曆」。
在「資料類型」部分,依序選取「日期和時間」和「日期小時分」。
點選對話方塊外的任一處,藉此關閉對話方塊。這個步驟中不需新增名稱。
在「設定」窗格的「指標」部分,點按「Record Count」並選取「meter reading」。
在本實驗室中,您成功使用 Dataflow pipeline 將資料串流至 BigQuery。
如果您已完成研究室,請按一下「End Lab」(關閉研究室)。Google Cloud Skills Boost 會移除您使用的資源,並清除所用帳戶。
您可以針對研究室的使用體驗評分。請選取合適的星級評等並提供意見,然後按一下「Submit」(提交)。
星級評等代表您的滿意程度:
如果不想提供意見回饋,您可以直接關閉對話方塊。
如有任何想法、建議或指教,請透過「Support」(支援) 分頁提交。
Copyright 2024 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验