准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
Create a view table
/ 30
Create a BQML model
/ 30
Fix the error and retrieve the top 10 purchases for each country.
/ 40
BigQuery 機器學習 (BigQuery ML) 可讓使用者運用 SQL 查詢,在 BigQuery 建立並執行機器學習模型,目標是讓 SQL 使用者能透過現有的工具建立模型,而且不必移動資料,可加快開發速度,使所有人都能輕鬆使用機器學習技術。
BigQuery 已載入電子商務資料集,其中包含數百萬筆 Google Analytics 的 Google 商品網路商店記錄。在本實驗室中,您將使用這些資料建立模型,預測訪客是否會完成交易。
如何在 BigQuery 建立、評估與使用機器學習模型
在每個研究室中,您都能在固定時間內免付費建立新的 Google Cloud 專案,並使用一組資源。
請透過無痕式視窗登入 Qwiklabs。
請記下研究室的存取時間 (例如 1:15:00),並確保自己能在時間限制內完成作業。
研究室不提供暫停功能。如有需要,您可以重新開始,但原先的進度恕無法保留。
準備就緒後,請按一下「Start lab」。
請記下研究室憑證 (使用者名稱和密碼),這組資訊將用於登入 Google Cloud 控制台。
按一下「Open Google Console」。
按一下「Use another account」,然後複製這個研究室的憑證,並貼入提示訊息。
如果使用其他憑證,系統會顯示錯誤或向您收取費用。
接受條款,然後略過資源復原頁面。
接著,畫面中會顯示「歡迎使用 Cloud 控制台中的 BigQuery」訊息方塊,當中會列出快速入門指南的連結和使用者介面更新內容。
在這項工作中,您將探索並準備機器學習模型要使用的公開資料集,執行 SQL 查詢來檢查 Google Analytics 資料樣本,然後將結果儲存為 training_data。
本實驗室要使用的資料位於 bigquery-public-data 專案,所有人皆可存取。我們來看看部分資料。
點選 Project_ID (開頭為 qwiklabs-gcp-00-XXXXXXXXXX) 左側的箭頭,確認是否有 bqml_lab 這個資料集。bqml_lab 資料集應會列在下方。
點選 圖示,建立新的 SQL 查詢。BigQuery Studio 中便會顯示新分頁。
選取查詢。
點選緊鄰查詢左側的 「Gemini Code Assist」按鈕。
點選「說明這項查詢」,
您會看到 Gemini 對話方塊在 BigQuery Studio 的右側開啟。
Gemini 窗格會顯示「Welcome to Gemini in Cloud Console」訊息。點選「Start Chatting」。對話視窗中會顯示類似下方內容的查詢說明。
Gemini 的回覆會類似下列內容:
點選「執行」。
點選「儲存」,然後選取「儲存 view」。
在「儲存 view」對話方塊中,點選「資料集」,然後選取「bqml_lab」。
在「資料表」欄位中輸入 training_data,然後點選「儲存」。
點選「Check my progress」,確認目標已達成。
在這項工作中,您將在 BigQuery 中使用 SQL 查詢自然語言提示詞,生成新的機器學習模型來預測訪客交易。您需要指定邏輯迴歸模型類型,然後使用現有的 training_data 訓練模型。
點選 圖示,建立新的 SQL 查詢。BigQuery Studio 中便會顯示新分頁。
點選 即可使用 SQL 生成工具,您會看到「透過 Gemini 生成 SQL」對話方塊。您可以在此視窗中輸入自然語言提示詞,生成新的 SQL 陳述式。
複製並貼上下列提示詞
點選「產生」,Gemini 會提供 SQL 查詢建議,類似下列內容:
點選「插入」。
點選「執行」。
在本例中,bqml_lab 是資料集名稱,sample_model 是模型名稱,training_data 則是我們在前一項工作中查看的交易資料。指定的模型類型是二元邏輯迴歸。
執行 CREATE MODEL 指令會建立非同步執行的查詢工作,這樣就能關閉或重新整理 BigQuery UI 視窗等。
點選「Check my progress」,確認目標已達成。
如果感興趣,您可以點選左選單中的 bqml_lab 資料集,按一下 UI 中的 sample_model 模型來取得模型資訊。在「詳細資料」下,您會找到一些基本的模型資訊,以及用於產生模型的訓練選項。在「訓練」下,您會看見類似下方的資料表:
在這項工作中,您將使用 ML.EVALUATE 函式評估機器學習模型的效能,藉此掌握重要指標,瞭解模型預測訪客交易時的準確度。
點選 圖示,建立新的 SQL 查詢。BigQuery Studio 中便會顯示新分頁。
點選 即可使用 SQL 生成工具,您會看到「透過 Gemini 生成 SQL」對話方塊。您可以在此視窗中輸入自然語言提示詞,生成新的 SQL 陳述式。
複製並貼上下列提示詞。
點選「產生」,Gemini 會提供 SQL 查詢建議,類似下列內容:
點選「插入」。
點選「執行」。
您會看見類似下方的資料表:
在這項工作中,您將學習如何使用 BigQuery 的 ML.PREDICT 函式進行預測,但在那之前,必須先對使用錯誤函式的查詢執行偵錯作業,透過 Gemini 找出並修正語法錯誤,然後再執行查詢,預測購買量排名前 10 的國家/地區。
在這項查詢中,您會發現 SELECT 和 FROM 部分與用於生成訓練資料的查詢類似,而且還加入了 fullVisitorId 欄,該欄將用於預測個別使用者的交易。至於 WHERE 部分,則反映出時間範圍的變化 (2017 年 7 月 1 日至 8 月 1 日)。
儲存這筆 7 月的資料,以便在後續步驟中搭配模型進行預測。
點選「儲存」,然後選取「儲存 view」。
在「儲存 view」對話方塊中,點選「資料集」,然後選取「bqml_lab」。
在「資料表」欄位中輸入 july_data,然後點選「儲存」。
預測各國家/地區的購買量
透過這項查詢,您將嘗試預測各國家/地區訪客的交易量、排序結果,並選出購買量排名前 10 的國家/地區:
點選 圖示,建立新的 SQL 查詢。
複製並貼上下列查詢。
點選「執行」。您會發現查詢執行失敗,畫面上會顯示下列錯誤訊息:
點選 BigQuery 中的 Gemini 對話視窗。
複製下列問題並貼到對話視窗中。
按下 SHIFT + ENTER 鍵或 Mac 的 SHIFT + return 鍵,在對話視窗中建立新行。
選取並複製查詢。
將查詢貼到您剛才輸入的問題後方。
按下 SHIFT + ENTER 鍵或 Mac 的 SHIFT + return 鍵,在對話視窗中建立新行。
複製並貼上下列句子:
點選「傳送提示詞」按鈕 。您會收到 Gemini 的回覆。
查看回覆中的建議。從這些建議中可看出,TOTAL() 不是 BigQuery 中有效的 SQL 匯總函式。
Gemini 在建議中提供了可行的解決方案,包括修正後的查詢,如下所示:
複製修正後的查詢。
點選 圖示,建立新的 SQL 查詢。
在新的「未命名的查詢」分頁中,貼上修正後的查詢。
點選「執行」。
本次查詢使用的是 ml.PREDICT,且查詢的 BigQuery ML (BigQuery 機器學習) 部分是用標準 SQL 指令包裹起來。在本實驗室中,您感興趣的是國家/地區與各國家/地區的總購買量,所以選擇使用 SELECT、GROUP BY 和 ORDER BY。LIMIT 則用於確保只會取得購買量前 10 多的結果。
您會看見類似下方的資料表:
點選「Check my progress」,確認目標已達成。
預測各使用者的購買量
這次,您將嘗試預測各訪客的交易量、排序結果,並選出交易量排名 10 的訪客。
如果您已完成研究室,請按一下「End Lab」(關閉研究室)。Google Cloud Skills Boost 會移除您使用的資源,並清除所用帳戶。
您可以針對研究室的使用體驗評分。請選取合適的星級評等並提供意見,然後按一下「Submit」(提交)。
星級評等代表您的滿意程度:
如果不想提供意見回饋,您可以直接關閉對話方塊。
如有任何想法、建議或指教,請透過「Support」(支援) 分頁提交。
Copyright 2022 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验