700개 이상의 실습 및 과정 이용하기

Vertex Pipelines를 사용하여 ML 파이프라인 만들기 및 실행

실습 3시간 30분 universal_currency_alt 크레딧 5개 show_chart 고급
info 이 실습에는 학습을 지원하는 AI 도구가 통합되어 있을 수 있습니다.
700개 이상의 실습 및 과정 이용하기

개요

이 실습에서는 Vertex Pipelines를 사용하여 ML 파이프라인을 만들고 실행하는 방법을 배웁니다.

학습 목표

  • Kubeflow Pipelines SDK를 사용하여 확장 가능한 ML 파이프라인 빌드
  • 텍스트 입력을 받는 3단계 인트로 파이프라인 만들기 및 실행
  • AutoML 분류 모델을 학습, 평가, 배포하는 파이프라인 만들기 및 실행
  • google_cloud_pipeline_components 라이브러리를 통해 제공되는 사전 빌드된 구성요소를 사용하여 Vertex AI 서비스와 상호작용
  • Cloud Scheduler로 파이프라인 작업 예약

설정 및 요건

각 실습에서는 정해진 기간 동안 새 Google Cloud 프로젝트와 리소스 집합이 무료로 제공됩니다.

  1. 시크릿 창을 사용하여 Qwiklabs에 로그인합니다.

  2. 실습 사용 가능 시간(예: 1:15:00)을 참고하여 해당 시간 내에 완료합니다.
    일시중지 기능은 없습니다. 필요한 경우 다시 시작할 수 있지만 처음부터 시작해야 합니다.

  3. 준비가 되면 실습 시작을 클릭합니다.

  4. 실습 사용자 인증 정보(사용자 이름비밀번호)를 기록해 두세요. Google Cloud Console에 로그인합니다.

  5. Google Console 열기를 클릭합니다.

  6. 다른 계정 사용을 클릭한 다음, 안내 메시지에 실습에 대한 사용자 인증 정보를 복사하여 붙여넣습니다.
    다른 사용자 인증 정보를 사용하는 경우 오류가 발생하거나 요금이 부과됩니다.

  7. 약관에 동의하고 리소스 복구 페이지를 건너뜁니다.

Cloud Shell 활성화

Cloud Shell은 여러 개발 도구가 포함된 가상 머신입니다. 5GB의 영구적인 홈 디렉터리를 제공하며 Google Cloud에서 실행됩니다. Cloud Shell을 사용하면 명령줄을 통해 Google Cloud 리소스에 액세스할 수 있습니다. gcloud는 Google Cloud의 명령줄 도구입니다. Cloud Shell에 사전 설치되어 있으며 탭 자동 완성을 지원합니다.

  1. Google Cloud Console의 탐색창에서 Cloud Shell 활성화(Cloud Shell 아이콘)를 클릭합니다.

  2. 계속을 클릭합니다.
    환경을 프로비저닝하고 연결하는 데는 몇 분 정도 소요됩니다. 연결되면 사용자 인증도 처리되어 프로젝트가 PROJECT_ID로 설정됩니다. 예를 들면 다음과 같습니다.

Cloud Shell 터미널

샘플 명령어

  • 활성 계정 이름을 나열합니다.

gcloud auth list

(출력)

Credentialed accounts: - <myaccount>@<mydomain>.com (active)

(출력 예시)

Credentialed accounts: - google1623327_student@qwiklabs.net
  • 프로젝트 ID를 나열합니다.

gcloud config list project

(출력)

[core] project = <project_ID>

(출력 예시)

[core] project = qwiklabs-gcp-44776a13dea667a6

작업 1. 클라우드 환경 설정하기

Cloud Shell에는 현재 Cloud 프로젝트의 이름이 포함된 GOOGLE_CLOUD_PROJECT를 비롯하여 몇 가지 환경 변수가 있는데, 이는 이 실습에서 여러 차례 사용됩니다. 다음을 실행하여 환경 변수를 확인할 수 있습니다.

echo $GOOGLE_CLOUD_PROJECT

API 사용 설정

  • 이러한 서비스가 필요한 경우와 그 이유는 이후 단계에서 설명하겠습니다. 우선 이 명령어를 실행하여 프로젝트에 Compute Engine, Container Registry, Vertex AI 서비스에 대한 액세스 권한을 부여해 보겠습니다.
gcloud services enable compute.googleapis.com \ containerregistry.googleapis.com \ aiplatform.googleapis.com \ cloudbuild.googleapis.com \ cloudfunctions.googleapis.com

그러면 다음과 비슷한 성공 메시지가 표시될 것입니다.

Operation "operations/acf.cc11852d-40af-47ad-9d59-477a12847c9e" finished successfully.

작업 2. Cloud Storage 버킷 만들기

Vertex AI에서 학습 작업을 실행하려면 저장된 모델 애셋을 저장할 스토리지 버킷이 필요합니다. 버킷은 리전별로 나뉘어 있어야 합니다. 다음 안내에서는 US-central 리전을 지정하지만 다른 리전을 사용할 수도 있습니다. 필요하면 실습 전체에서 바꾸어 사용하세요.

  1. 버킷을 만들려면 Cloud Shell 터미널에서 다음 명령어를 실행합니다.
BUCKET_NAME=gs://$GOOGLE_CLOUD_PROJECT-bucket gsutil mb -l us-central1 $BUCKET_NAME
  1. 다음 명령어를 사용해 이 버킷에 컴퓨터 서비스 계정에 대한 액세스를 부여합니다.
gcloud projects describe $GOOGLE_CLOUD_PROJECT > project-info.txt PROJECT_NUM=$(cat project-info.txt | sed -nre 's:.*projectNumber\: (.*):\1:p') SVC_ACCOUNT="${PROJECT_NUM//\'/}-compute@developer.gserviceaccount.com" gcloud projects add-iam-policy-binding $GOOGLE_CLOUD_PROJECT --member serviceAccount:$SVC_ACCOUNT --role roles/storage.objectAdmin

이렇게 하면 이 버킷에 파일을 쓰는 데 필요한 권한이 Vertex Pipelines에 부여됩니다.

작업 3. 권장 API 사용 설정하기

  1. Google Cloud 콘솔의 탐색 메뉴(탐색 메뉴)에서 Vertex AI > 대시보드를 클릭합니다.
  2. 모든 권장 API 사용 설정을 클릭합니다.

작업 4. Vertex AI Notebooks 인스턴스 실행

  1. Google Cloud 콘솔의 탐색 메뉴에서 Vertex AI > Workbench를 클릭합니다. 사용자 관리 노트북을 선택합니다.

  2. 노트북 인스턴스 페이지에서 새로 만들기를 클릭하고 환경에서 최신 버전의 TensorFlow Enterprise 2.6(LTS 포함)을 선택합니다.

  3. 새 노트북 인스턴스 대화상자에서 딥 러닝 VM의 이름을 확인합니다. 리전과 영역을 변경하고 싶지 않은 경우 모든 설정을 그대로 둔 후 만들기를 클릭합니다. 새 VM이 시작하는 데 2~3분 정도 걸립니다.

  4. JupyterLab 열기를 클릭합니다.
    JupyterLab 창이 새 탭에서 열립니다.

작업 5. Vertex AI Notebooks 인스턴스 내에서 코스 저장소 클론하기

다음과 같이 JupyterLab 인스턴스에서 training-data-analyst 노트북을 클론합니다.

  1. JupyterLab에서 터미널 아이콘을 클릭하여 새 터미널을 엽니다.

  2. 명령줄 프롬프트에서 다음 명령어를 실행합니다.

    git clone https://github.com/GoogleCloudPlatform/training-data-analyst
  3. training-data-analyst 디렉터리를 더블클릭하고 디렉터리의 콘텐츠를 볼 수 있는지 확인하여 저장소가 클론되었는지 확인합니다.
    이 과정의 모든 Jupyter 노트북 기반 실습 파일은 이 디렉터리에서 확인할 수 있습니다.

작업 6. Vertex Pipelines를 사용하여 ML 파이프라인 만들기 및 실행하기

  1. 노트북 인터페이스에서 training-data-analyst > courses > machine_learning > deepdive2 > machine_learning_in_the_enterprise > labs로 이동한 다음 pipelines_intro_kfp.ipynb를 엽니다.

  2. 노트북 인터페이스에서 Edit(수정) > Clear All Outputs(모든 출력 지우기)를 클릭합니다.

  3. 노트북 안내를 꼼꼼히 읽은 후, 필요에 따라 코드를 완성해야 하는 #TODO 표시된 행을 작성합니다.

팁: 현재 셀을 실행하려면 셀을 클릭하고 SHIFT+ENTER를 누르세요. 다른 셀 명령어는 노트북 UI의 Run(실행)에 나열되어 있습니다.

  • 안내를 위해 작업에서 힌트가 제공될 수 있습니다. 힌트는 흰색 텍스트로 적혀 있으므로 힌트를 읽으려면 텍스트를 하이라이트하세요.
  • 추가 도움이 필요하면 training-data-analyst > courses > machine_learning > deepdive2 > machine_learning_in_the_enterprise > solutions에서 pipelines_intro_kfp.ipynb를 열어 전체 솔루션을 살펴볼 수 있습니다.

실습 종료

실습을 완료하면 실습 종료를 클릭합니다. Qwiklabs에서 사용된 리소스를 자동으로 삭제하고 계정을 지웁니다.

실습 경험을 평가할 수 있습니다. 해당하는 별표 수를 선택하고 의견을 입력한 후 제출을 클릭합니다.

별점의 의미는 다음과 같습니다.

  • 별표 1개 = 매우 불만족
  • 별표 2개 = 불만족
  • 별표 3개 = 중간
  • 별표 4개 = 만족
  • 별표 5개 = 매우 만족

의견을 제공하고 싶지 않다면 대화상자를 닫으면 됩니다.

의견이나 제안 또는 수정할 사항이 있다면 지원 탭을 사용하세요.

Copyright 2020 Google LLC All rights reserved. Google 및 Google 로고는 Google LLC의 상표입니다. 기타 모든 회사명 및 제품명은 해당 업체의 상표일 수 있습니다.

시작하기 전에

  1. 실습에서는 정해진 기간 동안 Google Cloud 프로젝트와 리소스를 만듭니다.
  2. 실습에는 시간 제한이 있으며 일시중지 기능이 없습니다. 실습을 종료하면 처음부터 다시 시작해야 합니다.
  3. 화면 왼쪽 상단에서 실습 시작을 클릭하여 시작합니다.

시크릿 브라우징 사용

  1. 실습에 입력한 사용자 이름비밀번호를 복사합니다.
  2. 비공개 모드에서 콘솔 열기를 클릭합니다.

콘솔에 로그인

    실습 사용자 인증 정보를 사용하여
  1. 로그인합니다. 다른 사용자 인증 정보를 사용하면 오류가 발생하거나 요금이 부과될 수 있습니다.
  2. 약관에 동의하고 리소스 복구 페이지를 건너뜁니다.
  3. 실습을 완료했거나 다시 시작하려고 하는 경우가 아니면 실습 종료를 클릭하지 마세요. 이 버튼을 클릭하면 작업 내용이 지워지고 프로젝트가 삭제됩니다.

현재 이 콘텐츠를 이용할 수 없습니다

이용할 수 있게 되면 이메일로 알려드리겠습니다.

감사합니다

이용할 수 있게 되면 이메일로 알려드리겠습니다.

한 번에 실습 1개만 가능

모든 기존 실습을 종료하고 이 실습을 시작할지 확인하세요.

시크릿 브라우징을 사용하여 실습 실행하기

이 실습을 실행하려면 시크릿 모드 또는 시크릿 브라우저 창을 사용하세요. 개인 계정과 학생 계정 간의 충돌로 개인 계정에 추가 요금이 발생하는 일을 방지해 줍니다.