LookML을 사용한 캐싱 및 데이터 그룹

Apply a datagroup to an Explore

내 진행 상황 확인하기

/ 100

이 실습에는 학습을 지원하는 AI 도구가 통합되어 있을 수 있습니다.

GSP893

개요

Looker는 데이터를 대화식으로 분석하고 시각화하는 데 사용할 수 있는 Google Cloud의 최신 데이터 플랫폼입니다. Looker를 사용하여 심도 있게 데이터를 분석하고, 다양한 데이터 소스의 인사이트를 통합하고, 작업 가능한 데이터 기반 워크플로를 빌드하며, 커스텀 데이터 애플리케이션을 만들 수 있습니다.

Looker는 SQL 쿼리를 지속적으로 생성하여 연결된 데이터베이스에 전송합니다. Looker에서 쿼리가 실행될 때마다 SQL 결과가 Looker 인스턴스의 암호화된 파일에 캐싱되고 저장됩니다.

캐싱은 이전에 실행된 쿼리의 저장된 결과를 활용하기 때문에 데이터베이스에서 동일한 쿼리가 반복적으로 실행되는 일이 방지됩니다. 이로 인해 데이터베이스 부하가 줄어듭니다. 캐싱은 Looker 성능을 최적화하는 데도 도움이 됩니다. 이 실습에서는 Looker에서 캐싱이 작동하는 방식과 LookML 데이터 그룹을 사용하여 캐싱 정책을 정의하는 방법을 알아봅니다.

실습할 내용

캐싱과 LookML의 여러 데이터 그룹 객체 정의하기
LookML 모델의 개별 Explore에 데이터 그룹 적용하기

설정 및 요건

실습 시작 버튼을 클릭하기 전에

다음 안내를 확인하세요. 실습에는 시간 제한이 있으며 일시중지할 수 없습니다. 실습 시작을 클릭하면 타이머가 시작됩니다. 이 타이머는 Google Cloud 리소스를 사용할 수 있는 시간이 얼마나 남았는지를 표시합니다.

실무형 실습을 통해 시뮬레이션이나 데모 환경이 아닌 실제 클라우드 환경에서 직접 실습 활동을 진행할 수 있습니다. 실습 시간 동안 Google Cloud에 로그인하고 액세스하는 데 사용할 수 있는 새로운 임시 사용자 인증 정보가 제공됩니다.

이 실습을 완료하려면 다음을 준비해야 합니다.

표준 인터넷 브라우저 액세스 권한(Chrome 브라우저 권장)

참고: 이 실습을 실행하려면 시크릿 모드 또는 시크릿 브라우저 창을 사용하세요. 개인 계정과 학습자 계정 간의 충돌로 개인 계정에 추가 요금이 발생하는 일을 방지해 줍니다.

실습을 완료하기에 충분한 시간(실습을 시작하고 나면 일시중지할 수 없음)

참고: 계정에 추가 요금이 발생하지 않도록 하려면 개인용 Google Cloud 계정이나 프로젝트가 이미 있어도 이 실습에서는 사용하지 마세요.

실습을 시작하고 Looker에 로그인하는 방법

준비가 되면 실습 시작을 클릭합니다.

이 실습에서 사용해야 하는 임시 사용자 인증 정보가 '실습 세부정보' 창에 표시됩니다.

실습 비용을 결제해야 하는 경우 결제 수단을 선택할 수 있는 팝업이 열립니다.

'실습 세부정보' 창에 표시된 실습 사용자 인증 정보를 확인합니다. 이 실습에서 Looker 인스턴스에 로그인할 때 이 정보를 사용합니다.
참고: 다른 사용자 인증 정보를 사용하면 오류가 발생하거나 요금이 부과됩니다.
Looker 열기를 클릭합니다.
제공된 사용자 이름과 비밀번호를 이메일 및 비밀번호 입력란에 입력합니다.

사용자 이름:
{{{looker.developer_username | Username}}}
비밀번호:
{{{looker.developer_password | Password}}} 중요: 이 페이지의 '실습 세부정보' 창에 표시된 사용자 인증 정보를 사용해야 합니다. Google Cloud Skills Boost 사용자 인증 정보를 사용하지 마세요. 개인용 Looker 계정이 있더라도 이 실습에 사용하지 마세요.
로그인을 클릭합니다.

로그인이 완료되면 이 실습에서 사용할 Looker 인스턴스가 표시됩니다.

Looker에서 캐싱이 작동하는 방식

Looker는 데이터베이스의 정문 관리자로 기능합니다. 사용자가 쿼리를 실행하면 Looker는 동일한 쿼리가 이전에 실행된 적이 있는지 확인합니다. 실행된 적이 없으면 쿼리가 데이터베이스에서 실행되도록 허용합니다. 결과가 반환된 후에는 나중에 참조할 수 있도록 결과를 캐싱합니다.

동일한 쿼리가 이전에 실행된 적이 있는 경우 Looker는 캐싱 정책을 확인하여 이 결과가 여전히 유효한지 판단합니다. 여전히 유효하면 캐싱된 결과를 비즈니스 사용자에게 반환합니다. 이 과정은 1초 안에 이루어집니다.

동일한 쿼리가 이전에 실행된 적이 있으나 캐싱 정책에 따라 결과가 더 이상 유효하지 않은 경우에는 쿼리를 데이터베이스에 전송합니다. 그런 다음 나중에 참조할 수 있도록 새로운 결과를 캐싱합니다.

데이터 그룹

데이터 그룹은 이름이 지정된 캐싱 정책 또는 규칙을 가리키는 Looker 용어입니다. LookML 개발자는 데이터 그룹을 사용하여 Looker 인스턴스의 캐싱을 관리합니다. 서로 다른 캐싱 정책에는 서로 다른 데이터 그룹 정의가 필요합니다. 생성해야 하는 데이터 그룹의 수와 유형은 데이터의 추출, 변환, 로드(ETL) 프로세스 및 비즈니스 요구사항에 따라 달라집니다.

예를 들어 데이터가 업데이트되는 빈도에 따라 모델 수준에서, 개별 Explore별로 또는 영구 파생 테이블(PDT)에 대해 데이터 그룹을 정의해야 할 수 있습니다.

데이터 그룹을 모든 Explore의 기본값으로 적용하려면 모델 수준에서 persist_with 파라미터를 사용합니다.
데이터 그룹을 특정 Explore에 적용하려면 해당 Explore의 정의에서 persist_with 파라미터를 사용합니다.
모델의 모든 Explore가 아니라 일부 Explore에만 데이터 그룹을 적용하려면 각 Explore의 정의에서 persist_with 파라미터를 사용하고 동일한 데이터 그룹 이름을 지정합니다.

데이터 그룹을 사용할 수 있는 객체

`persist_with`

데이터 그룹을 모델 수준에서 적용하면 Looker는 기본적으로 이 모델 내의 모든 Explore에 동일한 캐싱 규칙을 적용합니다.

단, 개별 Explore에 데이터 그룹을 적용하여 모델 수준의 설정을 재정의할 수 있습니다. Explore는 모든 콘텐츠의 기반이므로 Explore의 Look과 대시보드에도 동일한 캐싱 로직이 적용됩니다.

참고: 데이터베이스 연결이 동적 사용자 이름을 사용하도록 Looker에서 구성된 경우에는 해당 연결을 사용하는 모델에 데이터 그룹을 사용할 수 없습니다. 대신 persist_for 파라미터를 사용하여 Explore 쿼리를 고정된 시간 동안 캐싱하고, 영구 파생 테이블에 sql_trigger_value 또는 persist_for를 사용하세요.

`datagroup_trigger`

PDT의 경우, 데이터 그룹을 적용하여 PDT가 다시 빌드되는 방식을 지정할 수 있습니다.

일정

데이터 그룹에서 Look 및 대시보드의 일정을 실행할 수도 있습니다. 캐싱 정책이 만료되면 자동으로 Look 또는 대시보드를 실행하여 새로운 데이터를 가져와서 이 데이터가 필요한 비즈니스 사용자를 위해 '사전 캐싱'하도록 Looker에 지시할 수 있습니다.

데이터 그룹 구성

데이터 그룹은 max_cache_age와 sql_trigger라는 두 개의 파라미터를 받습니다.

max_cache_age는 캐싱된 결과를 보관할 시간(예: 24시간)을 지정합니다.
sql_trigger는 결과가 변경되었는지 Looker에 알려 주는 SELECT 문을 작성하는 데 사용됩니다. sql_trigger는 하나의 값만 반환하도록 작성되어야 합니다. Looker는 이 문을 연결된 데이터베이스에 정기적으로 전송합니다. 결과가 변경된 경우에는 Looker가 캐싱을 새로고침합니다.

파라미터는 하나만 요구되지만, 원하는 캐싱 결과를 얻으려면 두 개의 파라미터를 모두 사용하는 것이 좋습니다. 예를 들어 sql_trigger 검사에서 변경사항이 감지되지 않았다면 ETL 프로세스 또는 sql_trigger 자체에 문제가 발생한 것일 수 있습니다. max_cache_age 파라미터를 사용하면 sql_trigger 검사 결과와 관계없이 설정된 기간이 지나면 캐싱이 새로고침됩니다.

참고: 두 파라미터 중 하나만 요구되지만 둘 다 사용하는 것이 좋습니다.

작업 1. Explore에 데이터 그룹 적용하기

LookML 모델에서 데이터 그룹을 정의하고 개별 Explore에 적용합니다. order_item_id는 Order Items의 기본 키입니다. 새 order_item_id가 추가될 때마다 새로고침되도록 Order Items Explore의 모든 뷰에 대해 캐싱을 업데이트합니다.

모델 열기

전환 버튼을 클릭하여 개발 모드로 전환합니다.
개발 탭에서 qwiklabs-ecommerce LookML 프로젝트를 선택합니다.
training_ecommerce.model 파일을 엽니다.

training_ecommerce.model 파일이 표시된 파일 브라우저 페이지

이 모델 파일에는 max_cache_age가 1시간인 기본 데이터 그룹이 있는 것을 볼 수 있습니다. Looker가 데이터베이스 스키마로부터 모델을 생성하도록 하여 새 LookML 프로젝트를 만들 때마다 Looker는 모델의 이름(여기서는 training_ecommerce) 뒤에 _default_datagroup을 붙여서 기본 데이터 그룹을 자동으로 만듭니다.

기본 데이터 그룹을 삭제하고 대체하기

이 기본 데이터 그룹은 현재 모델 수준에서 정의되어 있으므로 모델에서 정의된 모든 Explore에 적용됩니다. 데이터 그룹을 Explore에 적용하려면 기본 데이터 그룹을 삭제하고 업데이트해야 합니다. 새 데이터 그룹을 정의하려면 sql_trigger와 max_cache_age라는 두 파라미터에 값을 제공해야 합니다.

기본 데이터 그룹과 persist_with 정의(8~13번 줄)를 삭제합니다.
Order Items와 같은 특정 Explore에 대해 새 데이터 그룹을 만들려면 다음 코드를 입력합니다.

datagroup: order_items_datagroup {}

sql_trigger에 대해 order_item_id의 최대 ID를 선택하려면 다음 코드를 입력합니다.

sql_trigger: SELECT MAX(order_item_id) from order_items ;;

데이터 업데이트에 문제가 있더라도 캐싱이 매시간 계속해서 새로고침되도록 max_cache_age를 설정합니다. 다음 코드를 입력합니다.

max_cache_age: "1 hour"

max_cache_age가 업데이트된 training_ecommerce.model 파일

데이터 그룹 적용하기

데이터 그룹을 구성하는 것 자체로는 아무것도 수행되지 않습니다. 또 다른 단계를 수행해야 합니다. 데이터 그룹을 정의한 후에는 persist_with라는 파라미터를 사용하여 데이터 그룹을 객체에 적용해야 합니다.

Order Items Explore의 정의에 데이터 그룹을 적용하려면 explore: order_items 줄 바로 아래에 다음 코드를 입력합니다.

persist_with: order_items_datagroup

order_items Explore에 persist_with 코드가 추가된 training_ecommerce.model 파일

변경사항 저장을 클릭합니다.

변경사항 커밋 및 프로덕션에 배포

LookML 검사를 클릭한 다음 변경사항 커밋 및 푸시를 클릭합니다.
커밋 메시지를 추가하고 커밋을 클릭합니다.
마지막으로 프로덕션에 배포를 클릭합니다.

좋습니다. 새 주문 번호가 추가될 때마다 업데이트되도록 자체 캐싱 정책(데이터 그룹)을 정의하고, 데이터 업데이트와 관계없이 캐싱이 매시간 계속해서 새로고침되도록 1시간으로 설정된 max_caching_age 파라미터를 사용했습니다. 그런 다음 이 데이터 그룹을 전체 모델이 아니라 개별 Order Items Explore에 적용했습니다.

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. Explore에 데이터 그룹 적용하기

수고하셨습니다

이 실습에서는 Looker에서 캐싱을 정의하고 사용하는 방법과 LookML 데이터 그룹을 사용하여 캐싱 정책을 정의하는 방법을 알아보았습니다.

다음 단계/더 학습하기

Google Cloud 교육 및 자격증

Google Cloud 기술을 최대한 활용하는 데 도움이 됩니다. Google 강의에는 빠른 습득과 지속적인 학습을 지원하는 기술적인 지식과 권장사항이 포함되어 있습니다. 기초에서 고급까지 수준별 학습을 제공하며 바쁜 일정에 알맞은 주문형, 실시간, 가상 옵션이 포함되어 있습니다. 인증은 Google Cloud 기술에 대한 역량과 전문성을 검증하고 입증하는 데 도움이 됩니다.

설명서 최종 업데이트: 2025년 4월 24일

실습 최종 테스트: 2025년 4월 24일

GSP893

개요

실습할 내용

설정 및 요건

실습 시작 버튼을 클릭하기 전에

실습을 시작하고 Looker에 로그인하는 방법

Looker에서 캐싱이 작동하는 방식

데이터 그룹

데이터 그룹을 사용할 수 있는 객체

persist_with

datagroup_trigger

일정

데이터 그룹 구성

작업 1. Explore에 데이터 그룹 적용하기

모델 열기

기본 데이터 그룹을 삭제하고 대체하기

데이터 그룹 적용하기

변경사항 커밋 및 프로덕션에 배포

수고하셨습니다

다음 단계/더 학습하기

Google Cloud 교육 및 자격증

시작하기 전에

시크릿 브라우징 사용

콘솔에 로그인

시크릿 브라우징을 사용하여 실습 실행하기

`persist_with`

`datagroup_trigger`