Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Apply a datagroup to an Explore
/ 100
Looker 是 Google Cloud 的現代化資料平台,提供互動式分析功能,並可用圖表呈現資料。您能使用 Looker 深入分析資料、整合各種資料來源的洞察資訊、設定可做為行動依據的資料導向工作流程,以及建立自訂資料應用程式。
Looker 會持續生成 SQL 查詢並傳送至連線的資料庫。每當有人在 Looker 執行查詢,系統會快取 SQL 結果並儲存在 Looker 執行個體的加密檔案中。
快取功能會使用先前執行查詢時儲存的結果,避免對資料庫重複執行相同查詢。這有助於減輕資料庫負載,也可最佳化 Looker 的效能。在本實驗室中,您將瞭解 Looker 的快取機制,以及如何使用 LookML 資料群組定義快取政策。
請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。
您將在真正的雲端環境中完成實作實驗室活動,而不是在模擬或示範環境。為達此目的,我們會提供新的暫時憑證,讓您用來在研究室活動期間登入及存取 Google Cloud。
如要完成這個研究室活動,請先確認:
準備就緒後,請點選「Start Lab」。
「Lab Details」窗格會顯示本實驗室中必須使用的暫時憑證。
如果實驗室會產生費用,畫面中會出現選擇付款方式的彈出式視窗。
請在「Lab Details」窗格查看實驗室憑證,您之後會使用此憑證登入實驗室的 Looker 執行個體。
點選「Open Looker」。
分別在「Email」和「Password」欄位,輸入提供的使用者名稱和密碼。
使用者名稱:
密碼:
點選「Log In」。
成功登入後,您就會在本實驗室看到 Looker 執行個體。
Looker 就像資料庫的正門門衛。使用者執行查詢時,Looker 會判斷是否曾執行過完全相同的查詢。如果不曾,則允許查詢在資料庫中執行。傳回結果後,Looker 會快取結果供日後參考。
如果先前「曾」執行過相同查詢,Looker 會檢查快取政策,判斷結果是否仍然有效。如果有效,Looker 會將快取結果傳回給商業用戶。此程序不到一秒即可完成。
如果先前曾執行過相同查詢,但結果已根據快取政策而失效,Looker 會將查詢傳送至資料庫,接著快取新結果供日後參考。
「資料群組」是 Looker 用來指稱具名快取政策或規則的詞彙。LookML 開發人員會使用資料群組,在 Looker 執行個體上管理快取。不同的快取政策需要個別定義資料群組。您需要建立的資料群組數量和類型,取決於資料的擷取、轉換和載入 (ETL) 程序,以及業務需求。
舉例來說,視資料更新頻率而定,您可能需要在模型層級、個別探索或永久衍生資料表 (PDT) 中定義資料群組。
persist_with 參數。persist_with 參數。persist_with 參數,並指定相同的資料群組名稱。persist_with如果您在模型層級套用資料群組,Looker 預設會將相同的快取規則套用至該模型中的所有探索。
不過,您可以在「個別探索」中套用資料群組,覆寫模型層級的任何設定。由於探索是所有內容的基礎,因此相同的快取邏輯也適用於探索中的 Look 圖表和資訊主頁。
persist_for 參數,針對探索查詢快取一段固定時間,並使用 sql_trigger_value 或 persist_for 建立永久衍生資料表。datagroup_trigger關於 PDT,您可以套用資料群組來指定如何重建 PDT。
您也可以在資料群組中執行 Look 圖表和資訊主頁的排程。只要指示 Looker 在快取政策到期時自動執行 Look 圖表或資訊主頁,系統就會擷取新資料並「預先快取」,供有需要的商業用戶使用。
資料群組會採用兩個參數:max_cache_age 和 sql_trigger。
max_cache_age 可指定快取結果的保留時數,例如 24 小時。sql_trigger 可用於編寫 SELECT 陳述式,告知 Looker 結果是否已變更。sql_trigger 應編寫為只傳回一個值。Looker 會定期將這個陳述式傳送至連線的資料庫。若結果有變更,Looker 會重新整理快取。雖然只需要一個參數,但最好同時使用兩個參數,以便達到預期的快取結果。舉例來說,如果 sql_trigger 檢查未偵測到變更,可能表示 ETL 程序或 sql_trigger 本身發生錯誤。如果加入 max_cache_age 參數,無論 sql_trigger 檢查結果為何,快取都會在設定的時間長度後重新整理。
請在 LookML 模型中,為個別探索定義及套用資料群組。具體來說,您要更新「訂購商品」探索中所有檢視表的快取,每當新增 order_item_id 時就重新整理,因為 order_item_id 是「訂購商品」的主鍵。
按一下切換鈕進入「開發模式」。
在「開發」分頁中,選取 qwiklabs-ecommerce LookML 專案。
開啟 training_ecommerce.model 檔案。
請注意,這個模型檔案的預設資料群組 max_cache_age 為 1 小時。每當您建立新的 LookML 專案,並讓 Looker 從資料庫結構定義產生模型時,Looker 會自動建立預設資料群組,名稱為模型名稱 (本例為 training_ecommerce) 後面加上 _default_datagroup。
由於這個預設資料群組目前是在「模型」層級定義,因此會套用至模型中定義的所有探索。您要將資料群組套用至探索,因此必須移除預設群組並進行相應更新。為完成新資料群組的定義,您需要提供兩個參數的值:sql_trigger 和 max_cache_age。
刪除預設資料群組和 persist_with 定義 (第 8 至 13 行)。
如要為特定探索 (例如「訂購商品」) 建立新的資料群組,請輸入下列程式碼:
sql_trigger 部分輸入下列程式碼,藉此選取 order_item_id 的最大 ID:max_cache_age,這麼做即使資料更新發生問題,快取仍會每小時持續重新整理。請輸入以下程式碼:請注意,單獨設定資料群組不會有任何作用,您必須完成兩個步驟。定義資料群組後,您需要使用 persist_with 參數,將資料群組套用至物件。
explore: order_items 行下方直接輸入下列程式碼:依序點按「驗證 LookML」>「修訂變更並推送」。
新增修訂版本訊息,然後點按「修訂」。
最後,點按「部署至正式環境」。
太好了!您剛才定義了自己的快取政策 (資料群組),每當新增訂單編號時就會更新。您也將快取時間上限的參數設為 1 小時,因此無論資料是否更新,快取都會每小時重新整理。接著您將這個資料群組套用至個別的「訂購商品」探索,而非整個模型。
點選「Check my progress」,確認目標已達成。
在本實驗室中,您瞭解了如何在 Looker 中定義及使用快取,以及如何使用 LookML 資料群組定義快取政策。
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2025 年 4 月 24 日
實驗室上次測試日期:2025 年 4 月 24 日
Copyright 2025 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
This content is not currently available
We will notify you via email when it becomes available
Great!
We will contact you via email if it becomes available
One lab at a time
Confirm to end all existing labs and start this one