准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
Import a CSV file and create a standard table
/ 20
Create a table based on the results of a query using CTAS
/ 20
Work with nested data
/ 20
Deduplicate data
/ 20
Answer business questions with a report
/ 20
本實驗室是總整專案的一部分。您已瞭解雲端資料分析,以及資料歷程的前三階段:收集、處理和儲存。現在則要回顧這些知識並學以致用。
我們會設定情境,請您使用 BigQuery 完成一系列工作。過程中必須運用所學技能,在 BigQuery 環境中處理及轉換資料;回答資料相關問題;以及完成挑戰,評估您的資料轉換技能。
成功完成本實驗室,即代表您有能力使用 BigQuery 等雲端資料平台,儲存及分析資料。此外,您也能獲得實務經驗,運用 SQL 探索、篩選、簡化及匯總資料,滿足特定業務需求。
TheLook Fintech 是新成立的金融科技公司,專門向獨立網路商店業者發放貸款,提供進貨所需的資金。這間新創公司的使命是改變貸款方式,協助客戶拓展業務。儘管尚處於成長階段,但他們已成功鎖定目標市場,正致力迅速擴張事業版圖。
您獲聘成為該公司的雲端資料分析師。第一項任務是擬定並實施計畫,協助財務部門有效運用資料,追蹤績效和成長情形。
在與財務部門主管 Trevor 的會議中,您們找出三個業務問題。
這些問題包括:
與 Trevor 的會議也提供了重要資訊,包括解答上述業務問題所需的關鍵指標。
現金流是指一段時間內進出公司的資金流量。TheLook Fintech 必須確保還款和其他來源的資金流入量,大於放款和支付其他費用的資金流出量。
貸款目的是另一項需要追蹤的重要指標。Trevor 說明,借款人的申貸理由,與還款機率之間有很大關聯。為確保放款業務順利進行,監控貸款的主要用途至關重要。
借款人所在地也是重要考量。財務部希望瞭解貸款的地理分布情形,因為當貸款過度集中於特定地區時,集體違約風險便會隨之上升。相對而言,將貸款平均分配至不同地區,能避免過度依賴單一區域的還款來源,進而降低風險。
您的分析將著重於這三項重要指標。
本實驗室中需要使用 BigQuery 收集、處理及儲存資料,回答上述業務問題,並為 Trevor 準備一系列報表。
為此,您需要先設定 BigQuery 工作環境。接著,瀏覽貸款資料,找出 Trevor 要求的資訊。接下來,匯入檔案來導入州別這個新分類,並將資料儲存為標準資料表。然後,將兩個資料表彙整成一份報表。再來,簡化用途資料。最後,製作一份報表,列出每天和每年的貸款總金額。
請詳閱下列操作說明。實驗室活動會計時,中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。
您會在實際雲端環境完成實驗室活動,而非模擬或示範環境。因此,我們會提供新的臨時憑證,讓您在實驗室活動期間登入及存取 Google Cloud。
如要順利完成這個實驗室活動,請先確認:
點選「Start Lab」按鈕。左側的「Lab Details」面板會顯示下列項目:
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也可以按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」。「登入」頁面會在新的瀏覽器分頁開啟。
提示:為方便切換,可以將分頁安排在不同的視窗並排顯示。
如有需要,請複製下方的 Google Cloud 使用者名稱,然後貼到「登入」對話方塊。點選「下一步」。
您也可以在「Lab Details」面板找到 Google Cloud 使用者名稱。
您也可以在「Lab Details」面板找到 Google Cloud 密碼。
Cloud 控制台稍後會在這個分頁中開啟。
雲端資料分析師處理專案時,首要之務是啟用工作環境,並找出要分析的資料。
在這項工作中,您將啟用 BigQuery 環境、選取現有的 BigQuery 專案,並找出 Fintech 的資料集。
Fintech 資料集包含貸款資訊,可用於回答 Trevor 的業務問題。其中一項重要資訊是貸款總額。
在這項工作中,您將探索 Fintech 資料集,找出包含貸款總金額的資料表和資料欄。這項資訊對 Trevor 來說非常重要,有助於追蹤公司的現金流出量。
Trevor 解釋,TheLook Fintech 提供貸款後,客戶可動用資金的當天,稱為「放款」日。這是另一項重要資訊,有助於 Trevor 團隊追蹤每日或每月的現金支出總額。
請在 Fintech 資料集中,找出包含每筆貸款放款日的資料表,然後回答下列問題。
分析所需的大部分資料都在 Fintech 資料集中,但有些資料必須從其他來源收集。Trevor 提供了一個 CSV 檔案,將美國各州對應到不同區域和子區域。有了這項重要資訊,Trevor 就能追蹤借款人申貸的州別或地區。
CSV 檔案位於 Cloud Storage 的下列位置:
以下是 CSV 檔案中的資料範例:
在這項工作中,您會將 CSV 檔案匯入 BigQuery,並儲存為標準資料表。
複製上述指令並貼到「未命名」分頁中,使用 CSV 檔案中的資料建立標準資料表。
按一下「執行」。
接著,請查看您建立的資料表,並與原始 CSV 檔案比較:
在「Explorer」窗格中,選取 state_region 資料表。如果沒有看到資料表,可能需要重新整理資料集。
點選「預覽」分頁標籤,檢查您剛匯入 BigQuery 的資料。
點選「Check my progress」,確認工作已正確完成。
您已探索及收集所需資料,可以著手處理,以利後續分析了。
Trevor 希望取得一份包含 loan_id、loan_amount 和 region 名稱的報表。不過,這些資訊目前分散在兩個資料表內。
在本工作中,您會找出包含所需資料欄的資料表,並使用 SQL 彙整內容,進而建立報表。
查詢 A
查詢 B
Trevor 想使用 Google 試算表,另行篩選並分析報表內容。
但若要這麼做,您必須先建立資料表來儲存資料。
CTAS 陳述式 (或稱 CREATE TABLE AS SELECT 陳述式) 是一種 SQL 陳述式,會根據 SELECT 陳述式的結果新建資料表,是十分實用的工具。您也可在 BigQuery 中輕鬆匯出以 CTAS 陳述式建立的資料表,以便與他人共用。
在這項工作中,您將使用 CREATE TABLE AS SELECT 建立新資料表,然後將該資料表連結至 Google 試算表。
CREATE OR REPLACE TABLE 建立資料表或取代現有資料表。按一下「執行」。
找出新資料表。您可能需要重新整理!
點選「Check my progress」,確認工作已正確完成。
在「Explorer」窗格中,選取新建立的 loan_with_region 資料表 (如未看到此表,請按一下「重新整理」,即可重新整理資料集)。
如要開啟試算表,請在「開啟 Google 試算表」連結上按一下滑鼠右鍵,然後選取相應選項,在新的無痕視窗中開啟連結。
如要登入 Google Workspace,請使用當前實驗室頁面上的憑證 (使用者名稱和密碼)。
按一下工具列上的「開啟方式」,然後選取「連結試算表」。點選「開始」。
系統會開啟 Google 試算表,其中包含與連結資料表 loan_with_region 相同的資料。
查看 Google 試算表中的資料。
現在可以與 Trevor 分享 Google 試算表,讓對方以試算表格式處理資料了。
Trevor 正在研究客戶向 TheLook Fintech 貸款的主要原因,因為他發現,借款人的申貸理由是預測還款能力的有力指標。
他請您製作一份簡單的報表,列出每位借款人在申貸時所提到的用途。不過,由於這項資料是在申貸程序中收集,且儲存在名為「purpose」(用途) 的巢狀資料欄中,因此可能難以尋找。
在這項工作中,您會找出以巢狀形式列在申貸記錄中的「purpose」欄,並執行查詢,找出借款人貸款的原因。
在「Explorer」窗格中,選取 loan 資料表。
選取「結構定義」分頁標籤,然後找出「application」(申請) 欄。
在「結構定義」分頁中,按一下「application」旁邊的下拉式箭頭,展開記錄。
您認為下列查詢會從貸款資料表傳回每筆貸款的用途嗎?
這項查詢會傳回 loan 資料表中每筆貸款的用途。Trevor 可以藉此瞭解客戶向 TheLook Fintech 申貸的最常見原因。
我們會根據記錄名稱,加上資料欄名稱 (使用點標記法),來參照記錄中的資料欄 (或稱 struct)。舉例來說,如要參照 application 記錄中的 purpose 欄,請使用 application.purpose 標記。
點選「Check my progress」,確認工作已正確完成。
製作 Trevor 所需的貸款用途清單時,您發現了一些重複出現的借款人申貸原因。
例如「wedding」(婚禮) 這個原因就出現許多次。
查詢結果如下:
資料重複是雲端資料分析師經常遇到的問題。從資料集移除重複項目的程序稱為簡化。
fintech.loan_purposes 的資料表,當中只有名為 purpose 的一欄,內含 fintech.loan 資料表 purpose 欄中的不重複值。CREATE TABLE AS SELECT (CTAS) 陳述式執行這項操作。點選「Check my progress」,確認工作已正確完成。
Trevor 還需要一份報表,列出每年核發的貸款總金額。在這項工作中,您將編寫查詢來產生這份資料,然後運用結果建立資料表。
Trevor 說明他希望報表採用類似下圖的結構,且包含 issue_year 和 total_amount 欄。
接著,請檢查資料。
查詢結果大致如下:
請注意,查詢中使用了 GROUP BY 關鍵字和 sum() 函式
編寫查詢,在 fintech 資料集建立名為 loan_count_by_year 的資料表,依 issue_year 分類計算 loan_id 數量。
點選「Check my progress」,確認工作已正確完成。
身為 TheLook Fintech 的雲端資料分析師,您已成功提供 Trevor 和財務部門所需的資料,協助他們進一步瞭解公司的現金流,並做出明智的業務決策。
首先,您瀏覽了貸款資料,找出 Trevor 要求的資訊,例如 Fintech 資料集中的貸款總金額。
接下來,您匯入檔案來導入州別這個新類別,變更貸款區域分類方式,滿足 Trevor 的需求。
接著,您運用查詢結果建立新資料表,供 Trevor 建立內含貸款 ID、貸款金額和區域名稱的報表。
然後,您移除重複的記錄,簡化資料。
最後,您製作一份報表,列出每天和每年的貸款總金額,讓 Trevor 能夠更瞭解公司的現金流。
現在,您已瞭解如何收集、處理及儲存資料以供分析。
結束實驗室前,請確認已完成所有工作。如果已確定完成,請依序點選「End Lab」和「Submit」。
關閉實驗室後,就無法進入實驗室環境,也無法再次存取在實驗室完成的工作。
Copyright 2026 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验