700개 이상의 실습 및 과정 이용하기

Dataplex로 데이터 메시 빌드하기: 챌린지 실습

실습 1시간 30분 universal_currency_alt 크레딧 1개 show_chart 입문
info 이 실습에는 학습을 지원하는 AI 도구가 통합되어 있을 수 있습니다.
700개 이상의 실습 및 과정 이용하기

GSP514

Google Cloud 사용자 주도형 실습 로고

개요

챌린지 실습에서는 특정 시나리오와 일련의 작업이 주어집니다. 단계별 안내를 따르는 대신, 과정의 실습에서 배운 기술을 사용하여 스스로 작업을 완료하는 방법을 알아내 보세요. 이 페이지에 표시되어 있는 자동 채점 시스템에서 작업을 올바르게 완료했는지 피드백을 제공합니다.

챌린지 실습을 진행할 때는 새로운 Google Cloud 개념에 대한 정보가 제공되지 않습니다. 학습한 기술을 응용하여 기본값을 변경하거나 오류 메시지를 읽고 조사하여 실수를 바로잡아야 합니다.

100점을 받으려면 시간 내에 모든 작업을 성공적으로 완료해야 합니다.

이 실습은 Dataplex로 데이터 메시 빌드하기 기술 배지에 등록한 학습자에게 권장됩니다. 챌린지에 도전할 준비가 되셨나요?

설정 및 요건

실습 시작 버튼을 클릭하기 전에

다음 안내를 확인하세요. 실습에는 시간 제한이 있으며 일시중지할 수 없습니다. 실습 시작을 클릭하면 타이머가 시작됩니다. 이 타이머는 Google Cloud 리소스를 사용할 수 있는 시간이 얼마나 남았는지를 표시합니다.

실무형 실습을 통해 시뮬레이션이나 데모 환경이 아닌 실제 클라우드 환경에서 실습 활동을 진행할 수 있습니다. 실습 시간 동안 Google Cloud에 로그인하고 액세스하는 데 사용할 수 있는 새로운 임시 사용자 인증 정보가 제공됩니다.

이 실습을 완료하려면 다음을 준비해야 합니다.

  • 표준 인터넷 브라우저 액세스 권한(Chrome 브라우저 권장)
참고: 이 실습을 실행하려면 시크릿 모드(권장) 또는 시크릿 브라우저 창을 사용하세요. 개인 계정과 학습자 계정 간의 충돌로 개인 계정에 추가 요금이 발생하는 일을 방지해 줍니다.
  • 실습을 완료하기에 충분한 시간(실습을 시작하고 나면 일시중지할 수 없음)
참고: 이 실습에는 학습자 계정만 사용하세요. 다른 Google Cloud 계정을 사용하는 경우 해당 계정에 비용이 청구될 수 있습니다.

챌린지 시나리오

이제 막 주니어 데이터 엔지니어로 일하기 시작했다고 가정해 봅시다. 지금까지는 팀을 도와 Dataplex 애셋을 만들고 관리했습니다.

이러한 작업에 필요한 기술과 지식이 있어야 합니다.

챌린지

새롭게 구성된 개발팀에서 Dataplex를 사용하여 새 데이터 메시 빌드를 지원하라는 요청을 받았습니다. 구체적으로는 여러 영역 및 애셋이 있는 Dataplex 레이크를 만들어야 합니다. 또한 관점 유형을 만들고 새 레이크의 애셋에 관점을 추가하고 데이터 품질을 평가해야 하며, 다음과 같은 작업을 완료하라는 요청을 받습니다.

  • 두 개의 영역과 두 개의 애셋이 있는 Dataplex 레이크를 만듭니다.
  • 보호되는 데이터의 관점 유형을 만들고 영역에 관점을 추가합니다.
  • Dataplex IAM 역할을 다른 사용자에게 할당합니다.
  • 데이터 품질 사양 파일을 만들고 Cloud Storage에 업로드합니다.
  • Dataplex에서 데이터 품질 작업을 정의하고 실행합니다.

따라야 할 몇 가지 기준은 다음과 같습니다.

  • 필요한 모든 API(Dataplex, Data Catalog 및 Dataproc 등)이 성공적으로 사용 설정되었는지 확인합니다.
  • 달리 지시가 없는 한 모든 리소스는 리전에서 만듭니다.

각 작업은 아래에 자세히 설명되어 있습니다. 좋은 결과가 있길 바랍니다.

작업 1. 두 개의 영역과 두 개의 애셋이 있는 Dataplex 레이크 만들기

참고: 이 챌린지 실습의 모든 작업에서 달리 지시가 없는 한 리소스는 리전에서 만듭니다.

이 실습에서는 2단계를 위한 Cloud Storage 버킷 및 BigQuery 데이터 세트가 미리 만들어져 있습니다.

  1. 다음과 같은 두 개의 리전 영역이 있는 영업 레이크라는 이름의 Dataplex 레이크를 만듭니다.
  • 고객 원시 데이터 영역이라는 이름의 원시 데이터 영역
  • 고객 선별 데이터 영역이라는 이름의 선별 데이터 영역
  1. 각 영역에 미리 만들어진 하나의 애셋을 연결합니다.
  • 원시 데이터 영역에는 -customer-online-sessions라는 이름의 Cloud Storage 버킷을 고객 참여도라는 이름의 새 애셋으로 연결합니다.
  • 선별 데이터 영역에는 .customer_orders라는 이름의 BigQuery 데이터 세트를 고객 주문이라는 이름의 새 애셋으로 연결합니다.

Dataplex 레이크 생성을 위한 유용한 힌트

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. 두 개의 영역과 두 개의 애셋이 있는 Dataplex 레이크를 만듭니다.

작업 2. 관점 유형을 만들고 영역에 관점을 추가

  1. 다음과 같이 두 개의 열거형 필드가 있는 보호되는 고객 데이터 관점라는 이름의 관점 유형을 만듭니다.
  • 첫 번째 필드의 이름은 원시 데이터 플래그로, YesNo라는 두 개의 값이 있습니다.
  • 두 번째 필드의 이름은 보호되는 연락처 정보 플래그로, YesNo라는 두 개의 값이 있습니다.
  1. 두 플래그 모두에 대해 Yes 값을 사용하여 고객 원시 데이터 영역에 이 관점을 추가합니다.

관점 유형을 생성 및 적용하기 위한 유용한 힌트

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. 관점 유형을 만들고 영역에 관점을 추가

작업 3. Dataplex IAM 역할을 다른 사용자에게 할당

  • 최소 권한의 원칙을 사용해 적절한 Dataplex IAM 역할을 사용자 2()에 할당하여 고객 참여도라는 이름의 Dataplex 애셋에 새 Cloud Storage 파일을 업로드할 수 있도록 합니다.

Dataplex IAM 역할을 할당하기 위한 유용한 힌트

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. Dataplex IAM 역할을 다른 사용자에게 할당

작업 4. 데이터 품질 사양 파일을 만들고 Cloud Storage에 업로드

이 실습에서는 2단계를 위한 Cloud Storage 버킷이 미리 만들어져 있습니다.

  1. 다음과 같은 사양으로 dq-customer-orders.yaml이라는 이름의 데이터 품질 사양 파일을 만듭니다.
  • customer_orders.ordered_items 테이블의 user_id 열에 NOT NULL 규칙 적용(기준점 100%)
  • customer_orders.ordered_items 테이블의 order_id 열에 NOT NULL 규칙 적용(기준점 100%)
  • 결과를 위한 BigQuery 대상 테이블: .orders_dq_dataset.results
  1. -dq-config라는 이름의 Cloud Storage 버킷에 파일을 업로드합니다.

데이터 품질 사양 파일을 생성하기 위한 유용한 힌트

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. 데이터 품질 사양 파일을 만들고 업로드

작업 5. Dataplex에서 자동 데이터 품질 작업을 정의하고 실행

이 실습에서는 1단계를 위한 BigQuery 데이터 세트가 미리 만들어져 있습니다.

  1. 다음과 같은 사양으로 dq-customer-orders.yaml 파일을 사용하여 자동 데이터 품질 작업을 정의합니다.
속성
데이터 품질 작업 이름 customer-orders-data-quality-job
소스 데이터 .customer_orders.ordered_items
사용자 서비스 계정 Compute Engine 기본 서비스 계정
  1. 즉시 자동 데이터 품질 작업을 실행합니다.
작업이 시작되기까지 몇 분 정도 걸릴 수 있습니다. 작업이 성공적으로 실행되었는지 확인하기 위해 페이지를 새로고침해야 할 수 있습니다.

데이터 품질 작업을 정의 및 실행하기 위한 유용한 힌트

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. Dataplex에서 데이터 품질 작업을 정의하고 실행

수고하셨습니다

여러 영역 및 애셋을 사용해 Dataplex 레이크를 만들고, 관점 유형을 만들고 애셋에 관점을 추가하고, 데이터 품질을 평가하여 데이터 메시를 빌드했습니다.

Dataplex로 데이터 메시 빌드하기 배지

다음 기술 배지 획득

이 사용자 주도형 실습은 Dataplex로 데이터 메시 빌드하기 기술 배지에 포함되어 있습니다. 이 기술 배지 과정을 완료하면 위의 배지를 획득하여 수료를 인증할 수 있습니다. 이력서 및 소셜 미디어 플랫폼에 배지를 공유하고 #GoogleCloudBadge 해시태그를 사용해 스스로 달성한 업적을 널리 알리세요.

이 기술 배지 과정은 Google Cloud에서 제공하는 데이터 엔지니어 학습 과정의 일부입니다. 이 학습 과정의 다른 기술 배지 과정을 이미 완료했다면 카탈로그에서 등록할 수 있는 다른 기술 배지 퀘스트를 검색하세요.

Google Cloud 교육 및 자격증

Google Cloud 기술을 최대한 활용하는 데 도움이 됩니다. Google 강의에는 빠른 습득과 지속적인 학습을 지원하는 기술적인 지식과 권장사항이 포함되어 있습니다. 기초에서 고급까지 수준별 학습을 제공하며 바쁜 일정에 알맞은 주문형, 실시간, 가상 옵션이 포함되어 있습니다. 인증은 Google Cloud 기술에 대한 역량과 전문성을 검증하고 입증하는 데 도움이 됩니다.

설명서 최종 업데이트: 2025년 9월 4일

실습 최종 테스트: 2025년 9월 4일

Copyright 2025 Google LLC. All rights reserved. Google 및 Google 로고는 Google LLC의 상표입니다. 기타 모든 회사명 및 제품명은 해당 업체의 상표일 수 있습니다.

시작하기 전에

  1. 실습에서는 정해진 기간 동안 Google Cloud 프로젝트와 리소스를 만듭니다.
  2. 실습에는 시간 제한이 있으며 일시중지 기능이 없습니다. 실습을 종료하면 처음부터 다시 시작해야 합니다.
  3. 화면 왼쪽 상단에서 실습 시작을 클릭하여 시작합니다.

시크릿 브라우징 사용

  1. 실습에 입력한 사용자 이름비밀번호를 복사합니다.
  2. 비공개 모드에서 콘솔 열기를 클릭합니다.

콘솔에 로그인

    실습 사용자 인증 정보를 사용하여
  1. 로그인합니다. 다른 사용자 인증 정보를 사용하면 오류가 발생하거나 요금이 부과될 수 있습니다.
  2. 약관에 동의하고 리소스 복구 페이지를 건너뜁니다.
  3. 실습을 완료했거나 다시 시작하려고 하는 경우가 아니면 실습 종료를 클릭하지 마세요. 이 버튼을 클릭하면 작업 내용이 지워지고 프로젝트가 삭제됩니다.

현재 이 콘텐츠를 이용할 수 없습니다

이용할 수 있게 되면 이메일로 알려드리겠습니다.

감사합니다

이용할 수 있게 되면 이메일로 알려드리겠습니다.

한 번에 실습 1개만 가능

모든 기존 실습을 종료하고 이 실습을 시작할지 확인하세요.

시크릿 브라우징을 사용하여 실습 실행하기

이 실습을 실행하려면 시크릿 모드 또는 시크릿 브라우저 창을 사용하세요. 개인 계정과 학생 계정 간의 충돌로 개인 계정에 추가 요금이 발생하는 일을 방지해 줍니다.