시작하기 전에
- 실습에서는 정해진 기간 동안 Google Cloud 프로젝트와 리소스를 만듭니다.
- 실습에는 시간 제한이 있으며 일시중지 기능이 없습니다. 실습을 종료하면 처음부터 다시 시작해야 합니다.
- 화면 왼쪽 상단에서 실습 시작을 클릭하여 시작합니다.
Create Vertex AI Platform Notebooks instance and clone course repo
/ 10
Setup the data environment
/ 15
Create a custom Dataflow Flex Template container image
/ 15
Create and stage the flex template
/ 10
Execute the template from the UI and using gcloud commands
/ 20
이 실습에서 학습할 내용은 다음과 같습니다.
기본 요건:
명령줄 파라미터를 지원하는 파이프라인은 파라미터가 하드 코딩된 파이프라인보다 훨씬 활용도가 높습니다. 다만 이 파이프라인을 실행하려면 개발 환경을 먼저 구성해야 합니다. 여러 사용자나 다양한 환경에서 반복 실행할 것으로 예상되는 파이프라인의 경우 Dataflow 템플릿을 사용하는 것이 더 나은 옵션입니다.
Google Cloud Platform에는 이미 다양한 Dataflow 템플릿이 제공되고 있으며, Google 제공 템플릿 시작하기 가이드에서 자세히 살펴볼 수 있습니다. 하지만 이 실습의 파이프라인과 동일한 기능을 제공하지는 않습니다. 대신 이 실습에서는 파이프라인을 기존 커스텀 템플릿이 아닌 최신 커스텀 Dataflow Flex 템플릿으로 변환합니다.
파이프라인을 커스텀 Dataflow Flex 템플릿으로 변환하려면 코드와 종속 항목을 패키징하는 Docker 컨테이너, 빌드할 코드를 설명하는 Dockerfile, 런타임에 실행되어 실제 작업을 생성하는 기본 컨테이너를 빌드하는 Cloud Build, 작업 파라미터를 설명하는 메타데이터 파일을 사용해야 합니다.
각 실습에서는 정해진 기간 동안 새 Google Cloud 프로젝트와 리소스 집합이 무료로 제공됩니다.
시크릿 창을 사용하여 Google Skills에 로그인합니다.
실습 사용 가능 시간(예: 1:15:00)을 참고하여 해당 시간 내에 완료합니다.
일시중지 기능은 없습니다. 필요한 경우 다시 시작할 수 있지만 처음부터 시작해야 합니다.
준비가 되면 실습 시작을 클릭합니다.
실습 사용자 인증 정보(사용자 이름 및 비밀번호)를 기록해 두세요. Google Cloud Console에 로그인합니다.
Google Console 열기를 클릭합니다.
다른 계정 사용을 클릭한 다음, 안내 메시지에 이 실습에 대한 사용자 인증 정보를 복사하여 붙여넣습니다. 다른 사용자 인증 정보를 사용하는 경우 오류가 발생하거나 요금이 부과됩니다.
약관에 동의하고 리소스 복구 페이지를 건너뜁니다.
Google Cloud에서 작업을 시작하기 전에 프로젝트가 Identity and Access Management(IAM) 내에서 올바른 권한을 보유하고 있는지 확인해야 합니다.
Google Cloud 콘솔의 탐색 메뉴()에서 IAM 및 관리자 > IAM을 선택합니다.
기본 컴퓨팅 서비스 계정 {project-number}-compute@developer.gserviceaccount.com이 있고 editor 역할이 할당되어 있는지 확인하세요. 계정 프리픽스는 프로젝트 번호이며, 이 번호는 탐색 메뉴 > Cloud 개요 > 대시보드에서 확인할 수 있습니다.
editor 역할이 없는 경우 다음 단계에 따라 필요한 역할을 할당합니다.729328892908)를 복사합니다.{project-number}는 프로젝트 번호로 바꿉니다.Google Cloud 콘솔의 탐색 메뉴()에서 Vertex AI를 선택합니다.
모든 권장 API 사용 설정을 클릭합니다.
탐색 메뉴에서 Workbench를 클릭합니다.
Workbench 페이지 상단에서 인스턴스 뷰에 있는지 확인합니다.
새로 만들기를 클릭합니다.
인스턴스를 구성합니다.
인스턴스를 만드는 데 몇 분 정도 걸립니다. 준비되면 이름 옆에 녹색 체크표시가 나타납니다.
다음으로 이 실습에서 사용할 코드 저장소를 다운로드합니다.
노트북 환경의 왼쪽 패널에 있는 파일 브라우저에서 training-data-analyst 저장소가 추가된 것을 확인할 수 있습니다.
클론된 저장소인 /training-data-analyst/quests/dataflow_python/으로 이동합니다. 각 실습의 폴더가 표시됩니다. 이 폴더는 사용자가 완료해야 하는 코드가 포함된 lab 하위 폴더와, 문제 발생 시 참고할 수 있는 정상 작동 예시가 포함된 solution 하위 폴더로 나뉩니다.
내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.
이 실습에서는 브랜칭 파이프라인 실습(솔루션 폴더)의 기존 파이프라인 코드를 활용합니다.
실제 파이프라인 코드를 편집하기 전에 필요한 종속 항목이 설치되어 있는지 확인해야 합니다.
my_pipeline.py 파일을 업데이트합니다. 솔루션 파일은 training-data-analyst/quests/dataflow_python/2_Branching_Pipelines/solution/에서 찾을 수 있습니다.내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.
pip3 freeze를 사용하여 환경에서 사용 중인 패키지와 버전을 기록합니다.다음으로 Dockerfile을 만듭니다. 이를 통해 사용할 코드와 종속 항목을 지정합니다.
a. 이 작업을 완료하려면 IDE의 파일 탐색기에서 dataflow_python/2_Branching_Pipelines/lab 폴더에 새 파일을 만듭니다.
b. 새 파일을 만들려면 파일 >> 새 파일 >> 텍스트 파일을 클릭합니다.
c. 파일을 마우스 오른쪽 버튼으로 클릭하여 파일 이름을 Dockerfile로 변경합니다.
d. 편집기 패널에서 Dockerfile 파일을 클릭하여 엽니다.
e. 아래 코드를 Dockerfile 파일에 복사한 후 저장합니다.
컨테이너를 빌드하고 푸시하는 데 몇 분 정도 걸릴 수 있습니다.
내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.
템플릿을 실행하려면 SDK 정보, 메타데이터 등 작업을 실행하는 데 필요한 모든 정보가 포함된 템플릿 사양 파일을 Cloud Storage에 만들어야 합니다.
a. IDE의 파일 탐색기에서 dataflow_python/2_Branching_Pipelines/lab 폴더에 새 파일을 만듭니다.
b. 새 파일을 만들려면 파일 >> 새 파일 >> 텍스트 파일을 클릭합니다.
c. 파일을 마우스 오른쪽 버튼으로 클릭하여 파일 이름을 metadata.json로 변경합니다.
d. 편집기 패널에서 metadata.json 파일을 엽니다. 파일을 열려면 metadata.json 파일을 마우스 오른쪽 버튼으로 클릭한 다음 다음으로 열기 >> 편집기를 선택합니다.
e. 이 작업을 완료하려면 파이프라인이 예상하는 모든 입력 파라미터를 포함하도록 다음 형식으로 metadata.json 파일을 만들어야 합니다. 필요한 경우 솔루션을 참고하세요. 이를 위해서는 파라미터 정규 표현식 검사를 직접 작성해야 합니다. 권장사항은 아니지만 ".*"는 어떤 입력과도 일치할 수 있습니다.
내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.
이 작업을 완료하려면 아래의 안내를 따르세요.
Google Cloud 콘솔의 Dataflow 페이지로 이동합니다.
템플릿에서 작업 생성을 클릭합니다.
작업 이름 필드에 작업 이름을 입력합니다.
리전 엔드포인트를
Dataflow 템플릿 드롭다운 메뉴에서 커스텀 템플릿을 선택합니다.
템플릿 파일의 Cloud Storage 경로를 템플릿 Cloud Storage 경로 필드에 입력합니다.
필수 파라미터 아래에 해당 항목을 입력합니다.
a. 입력 파일 경로에
b. 출력 파일 위치에
c. BigQuery 출력 테이블에
작업 실행을 클릭합니다.
Dataflow 템플릿을 사용하면 개발 환경 외에도 더 다양한 컨텍스트에서 템플릿을 실행할 수 있다는 이점이 있습니다. 직접 확인해 보기 위해 gcloud를 사용하여 명령줄에서 Dataflow 템플릿을 실행합니다.
내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.
실습을 완료하면 실습 종료를 클릭합니다. Google Skills에서 사용된 리소스를 자동으로 삭제하고 계정을 지웁니다.
실습 경험을 평가할 수 있습니다. 해당하는 별표 수를 선택하고 의견을 입력한 후 제출을 클릭합니다.
별점의 의미는 다음과 같습니다.
의견을 제공하고 싶지 않다면 대화상자를 닫으면 됩니다.
의견이나 제안 또는 수정할 사항이 있다면 지원 탭을 사용하세요.
Copyright 2026 Google LLC All rights reserved. Google 및 Google 로고는 Google LLC의 상표입니다. 기타 모든 회사명 및 제품명은 해당 업체의 상표일 수 있습니다.
현재 이 콘텐츠를 이용할 수 없습니다
이용할 수 있게 되면 이메일로 알려드리겠습니다.
감사합니다
이용할 수 있게 되면 이메일로 알려드리겠습니다.
한 번에 실습 1개만 가능
모든 기존 실습을 종료하고 이 실습을 시작할지 확인하세요.