실습 설정 안내 및 요구사항
계정과 진행 상황을 보호하세요. 이 실습을 실행하려면 항상 시크릿 브라우저 창과 실습 사용자 인증 정보를 사용하세요.

Apache Beam 및 Bigtable을 사용하여 e스포츠 DLC 데이터 보강

실습 1시간 30분 universal_currency_alt 크레딧 1개 show_chart 입문
info 이 실습에는 학습을 지원하는 AI 도구가 통합되어 있을 수 있습니다.
이 콘텐츠는 아직 휴대기기에 최적화되지 않음
최상의 경험을 위해 데스크톱 컴퓨터에서 이메일로 전송된 링크를 사용하여 방문하세요.

GSP1345

Google Cloud 사용자 주도형 실습 로고

개요

여러분이 Cymbal Gaming의 데이터 엔지니어라고 가정해 보세요. 개발팀과 함께 'Galactic Grand Prix'라는 새로운 e스포츠 게임을 빌드하고 있습니다. 이 게임은 서로 다른 팀의 두 플레이어가 펼치는 일대일 게임을 기반으로 실시간 데이터를 생성합니다. 예를 들어 두 명의 플레이어가 이벤트에서 경쟁하고, 승자가 결정되며, 승리한 플레이어와 팀에 포인트가 부여됩니다. 여러분은 DLC 구매 데이터에 따른 추천을 생성하는 업무를 맡게 되었습니다. 플레이어가 Galactic Grand Prix에서 캐릭터용 DLC를 구매하면, 다른 경쟁자가 구매하는 항목을 기반으로 해당 플레이어에게 다른 항목을 추천해야 합니다.

여러분은 Pub/Sub에 대해 읽어보았고 Google Cloud에서 스트리밍 데이터와 함께 사용할 수 있다는 것을 알고 있습니다. 또한 Dataflow(Google Cloud의 관리형 Apache Beam 서비스)와 Google Cloud의 NoSQL 데이터베이스인 Bigtable에 대해서도 읽어보았습니다. 이러한 서비스를 Jupyter 노트북과 함께 사용하여 구매에 따라 다른 DLC 항목을 고객에게 추천하는 솔루션을 빌드할 수 있을 것 같지만 어디서부터 시작해야 할지 잘 모르겠습니다.

실습을 시작하면 환경에 다음 다이어그램에 표시된 리소스가 포함됩니다.

실습을 마치면 아키텍처를 사용하여 여러 작업을 수행할 수 있게 됩니다.

다음 표에서 실습 아키텍처와 관련된 각 작업의 자세한 설명을 살펴볼 수 있습니다.

작업 순서 세부정보
1. Google Cloud 리소스 만들기: 이 작업에서는 Pub/Sub 주제 및 구독과 BigTable 인스턴스를 만듭니다. 테이블은 나중에 노트북에서 만듭니다.
2. Vertex AI Workbench에서 노트북을 열고 커널을 선택합니다.
3. 패키지를 설치하고 프로젝트에 맞게 노트북 구성:
이 실습에서는 텐서 모델인 PyTorch와 DataFlow 통합을 지원하는 Apache Beam을 비롯한 다양한 Python 라이브러리를 사용합니다. 이러한 라이브러리는 실습이 프로비저닝되면 설치되며, 실습 전반에서 Jupyter 노트북에서 참조하게 됩니다. 또한 실습 시작 시 제공된 Cloud Storage 버킷과 같은 프로젝트의 리소스에 액세스할 수 있도록 노트북을 구성해야 합니다.
4. 모델 학습:
이 작업에서는 DLC 제품에 대한 Galactic Grand Prix 플레이어 구매 데이터를 사용해 텐서로 PyTorch 모델을 학습시킵니다.
5. BigTable 테이블 구성 및 Pub/Sub에 메시지 게시:
이 작업에서는 인스턴스 내에서 BigTable 테이블을 구성하고 Pub/Sub 구독에 메시지를 게시합니다.
6. BigTable 보강 핸들러 및 변환 사용:
이 작업에서는 BigTable 보강 핸들러 및 변환을 사용합니다.
7. 추론 및 파이프라인 실행:
이 작업에서는 PyTorchModelHandlerTensor 인터페이스를 사용하여 추론을 실행한 다음 파이프라인을 실행합니다.

목표

이 실습에서 학습할 내용은 다음과 같습니다.

  • 텐서로 표현된 구매 데이터로 PyTorch 모델을 학습시킵니다.
  • Pub/Sub에서 수신한 신규 구매를 인구통계 데이터로 보강합니다.
  • Dataflow 파이프라인을 사용하여 신규 고객에게 제품을 추천합니다.

설정 및 요건

실습 시작 버튼을 클릭하기 전에

다음 안내를 확인하세요. 실습에는 시간 제한이 있으며 일시중지할 수 없습니다. 실습 시작을 클릭하면 타이머가 시작됩니다. 이 타이머는 Google Cloud 리소스를 사용할 수 있는 시간이 얼마나 남았는지를 표시합니다.

실무형 실습을 통해 시뮬레이션이나 데모 환경이 아닌 실제 클라우드 환경에서 실습 활동을 진행할 수 있습니다. 실습 시간 동안 Google Cloud에 로그인하고 액세스하는 데 사용할 수 있는 새로운 임시 사용자 인증 정보가 제공됩니다.

이 실습을 완료하려면 다음을 준비해야 합니다.

  • 표준 인터넷 브라우저 액세스 권한(Chrome 브라우저 권장)
참고: 이 실습을 실행하려면 시크릿 모드(권장) 또는 시크릿 브라우저 창을 사용하세요. 개인 계정과 학습자 계정 간의 충돌로 개인 계정에 추가 요금이 발생하는 일을 방지해 줍니다.
  • 실습을 완료하기에 충분한 시간(실습을 시작하고 나면 일시중지할 수 없음)
참고: 이 실습에는 학습자 계정만 사용하세요. 다른 Google Cloud 계정을 사용하는 경우 해당 계정에 비용이 청구될 수 있습니다.

실습을 시작하고 Google Cloud 콘솔에 로그인하는 방법

  1. 실습 시작 버튼을 클릭합니다. 실습 비용을 결제해야 하는 경우 결제 수단을 선택할 수 있는 대화상자가 열립니다. 왼쪽에는 다음과 같은 항목이 포함된 실습 세부정보 창이 있습니다.

    • Google Cloud 콘솔 열기 버튼
    • 남은 시간
    • 이 실습에 사용해야 하는 임시 사용자 인증 정보
    • 필요한 경우 실습 진행을 위한 기타 정보
  2. Google Cloud 콘솔 열기를 클릭합니다(Chrome 브라우저를 실행 중인 경우 마우스 오른쪽 버튼으로 클릭하고 시크릿 창에서 링크 열기를 선택합니다).

    실습에서 리소스가 가동되면 다른 탭이 열리고 로그인 페이지가 표시됩니다.

    팁: 두 개의 탭을 각각 별도의 창으로 나란히 정렬하세요.

    참고: 계정 선택 대화상자가 표시되면 다른 계정 사용을 클릭합니다.
  3. 필요한 경우 아래의 사용자 이름을 복사하여 로그인 대화상자에 붙여넣습니다.

    {{{user_0.username | "Username"}}}

    실습 세부정보 창에서도 사용자 이름을 확인할 수 있습니다.

  4. 다음을 클릭합니다.

  5. 아래의 비밀번호를 복사하여 시작하기 대화상자에 붙여넣습니다.

    {{{user_0.password | "Password"}}}

    실습 세부정보 창에서도 비밀번호를 확인할 수 있습니다.

  6. 다음을 클릭합니다.

    중요: 실습에서 제공하는 사용자 인증 정보를 사용해야 합니다. Google Cloud 계정 사용자 인증 정보를 사용하지 마세요. 참고: 이 실습에 자신의 Google Cloud 계정을 사용하면 추가 요금이 발생할 수 있습니다.
  7. 이후에 표시되는 페이지를 클릭하여 넘깁니다.

    • 이용약관에 동의합니다.
    • 임시 계정이므로 복구 옵션이나 2단계 인증을 추가하지 않습니다.
    • 무료 체험판을 신청하지 않습니다.

잠시 후 Google Cloud 콘솔이 이 탭에서 열립니다.

참고: Google Cloud 제품 및 서비스에 액세스하려면 탐색 메뉴를 클릭하거나 검색창에 제품 또는 서비스 이름을 입력합니다. 탐색 메뉴 아이콘 및 검색창

작업 1: Google Cloud 리소스 만들기

이 작업에서는 Pub/Sub 주제 및 구독, BigTable 인스턴스를 포함하여 실습을 지원하는 Google Cloud 리소스를 만듭니다. 참고: 프로세스를 신속하게 진행하기 위해 Cloud Shell 명령어를 사용하여 이러한 리소스를 만듭니다.

gcloud CLI 명령어를 효과적으로 사용하기 위해 먼저 Google Cloud Shell에 액세스하고 환경 변수를 설정합니다.

Cloud Shell에 액세스하고 환경 변수 설정

  1. Cloud Shell 활성화를 클릭하여 Cloud Shell을 엽니다.

  2. 이 실습에서 Cloud Shell을 처음 사용하므로 사용을 승인해야 합니다. 이를 위해서는 계속을 클릭한 다음 팝업 창에서 승인을 클릭합니다.

  3. 다음 명령어를 실행합니다.

    export PROJECT_ID="{{{project_0.project_id|set at lab start}}}"
  4. 아래 명령어를 실행하여 변수가 저장되었는지 확인합니다.

    echo ${PROJECT_ID}

    이러한 변수는 실습 후반부에서 사용합니다.

Bigtable 인스턴스 만들기

  1. 다음 명령어를 실행하여 Bigtable 인스턴스를 만듭니다.

    gcloud bigtable instances create instance \ --display-name="My Bigtable Instance" \ --cluster-config=id=my-cluster,zone={{{project_0.default_zone | Zone}}},nodes=1

    인스턴스가 생성되었음을 나타내는 확인 메시지가 표시됩니다.

    참고: BigTable 테이블은 나중에 Jupyter 노트북 내에서 만듭니다.

Pub/Sub 주제 및 구독 만들기

  1. 다음 명령어를 실행하여 Pub/Sub 주제를 만듭니다.

    gcloud pubsub topics create customer-data

    Pub/Sub 주제가 생성되었음을 나타내는 확인 메시지가 표시됩니다.

  2. 다음 명령어를 실행하여 주제에 대한 Pub/Sub 구독을 만듭니다.

    gcloud pubsub subscriptions create customer-data_sub --topic=customer-data

    주제에 구독이 추가되었음을 나타내는 확인 메시지가 표시됩니다.

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. Google Cloud 리소스 만들기

작업 2. Vertex AI Workbench에서 노트북을 열고 커널 선택

작업 2a. 노트북 열기

  1. Google Cloud 콘솔의 탐색 메뉴(탐색 메뉴 아이콘)에서 Vertex AI > Workbench를 클릭합니다.

  2. 인스턴스를 찾아 JupyterLab 열기 버튼을 클릭합니다.

Workbench 인스턴스의 JupyterLab 인터페이스가 새 브라우저 탭에서 열립니다.

참고: JupyterLab에 노트북이 표시되지 않는다면 다음 추가 단계에 따라 인스턴스를 재설정하세요.

1. JupyterLab의 브라우저 탭을 닫고 Workbench 홈페이지로 돌아갑니다.

2. 인스턴스 이름 옆의 체크박스를 선택하고 재설정을 클릭합니다.

3. JupyterLab 열기 버튼이 다시 사용 설정되면 1분 정도 기다린 후 JupyterLab 열기를 클릭합니다.

작업 2b. 커널 선택

  1. 파일을 엽니다.

  2. '커널 선택' 대화상자에서 사용 가능한 커널 목록 중 Python 3을 선택합니다.

작업 3. Python 패키지 가져오기 및 환경 변수 설정

이 작업에서는 이 노트북을 사용하고 환경 변수를 설정하는 데 필요한 Python 패키지를 가져옵니다.

  1. 노트북의 작업 3 패키지 설치 및 노트북 구성 섹션에 나온 단계를 완료합니다.

    프로젝트 ID로는 을(를) 사용하고, instance_id로는 instance를 사용하며, table_id로는 customer_data를 사용합니다. 작업 1에서 Bigtable 인스턴스를 만들었습니다. 지금 이러한 값을 설정해야 이 노트북의 후속 작업을 성공적으로 완료할 수 있으며, 설정하지 않을 경우 오류가 발생할 수 있습니다.

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. 패키지 설치 및 노트북 구성

작업 4. 모델 학습시키기

이 작업에서는 데이터 세트를 만들고 데이터 세트 내 데이터를 텐서로 변환합니다. 그런 다음 PyTorch 모델을 빌드하고 이러한 텐서로 학습시킵니다.

  1. 노트북의 모델 학습 섹션을 완료합니다.

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. 모델 학습시키기

작업 5. BigTable 테이블 구성 및 Pub/Sub에 메시지 게시

이 작업에서는 column family를 사용하여 BigTable 테이블을 만들고 구성한 다음 테이블에 데이터를 로드합니다. 또한 Pub/Sub에 메시지를 게시합니다.

  1. 노트북의 BigTable 테이블 구성 및 Pub/Sub에 메시지 게시 섹션을 실행합니다.

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. BigTable 테이블 구성 및 Pub/Sub에 메시지 게시

작업 6. BigTable 보강 핸들러 및 변환 사용

이 작업에서는 BigTable을 데이터 소스로 사용하여 보강 프로세스를 수행하는, Dataflow 파이프라인 내에서 사용되는 특수 커넥터인 BigTable 보강 핸들러를 사용하게 됩니다. 또한 BigTable 보강 변환을 사용합니다. BigTable 보강 핸들러를 도구로, 변환을 코드에서 도구를 시작하는 동사로 생각하세요.

  1. 노트북의 BigTable 보강 핸들러 및 변환 사용 섹션을 실행합니다.

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. BigTable 보강 핸들러 및 변환 사용

작업 7. 추론 및 파이프라인 실행

이 작업에서는 PyTorch 모델로 추론을 실행하고 Dataflow 파이프라인을 실행합니다.

  1. 노트북의 추론 및 파이프라인 실행 섹션을 실행합니다.
중요: 노트북에 설명된 대로, 마지막 셀에서 파이프라인이 세 가지 추천을 제공한 후에도 셀이 계속 실행됩니다. 수동으로 중지해야 합니다. 셀을 수동으로 중지하지 않으면 실습 환경의 시간이 초과될 때 파이프라인이 자동으로 중지됩니다.

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. 추론 및 파이프라인 실행

수고하셨습니다

이 실습에서는 텐서로 표현된 구매 데이터로 PyTorch 모델을 학습시키는 방법을 배웠습니다. 또한 Pub/Sub에서 수신한 신규 구매를 인구통계 데이터로 보강한 다음 Dataflow 파이프라인을 사용하여 고객에게 새로운 DLC 제품을 추천하는 방법도 배웠습니다.

Google Cloud 교육 및 자격증

Google Cloud 기술을 최대한 활용하는 데 도움이 됩니다. Google 강의에는 빠른 습득과 지속적인 학습을 지원하는 기술적인 지식과 권장사항이 포함되어 있습니다. 기초에서 고급까지 수준별 학습을 제공하며 바쁜 일정에 알맞은 주문형, 실시간, 가상 옵션이 포함되어 있습니다. 인증은 Google Cloud 기술에 대한 역량과 전문성을 검증하고 입증하는 데 도움이 됩니다.

설명서 최종 업데이트: 2026년 1월 22일

실습 최종 테스트: 2026년 1월 22일

Copyright 2026 Google LLC. All rights reserved. Google 및 Google 로고는 Google LLC의 상표입니다. 기타 모든 회사명 및 제품명은 해당 업체의 상표일 수 있습니다.

시작하기 전에

  1. 실습에서는 정해진 기간 동안 Google Cloud 프로젝트와 리소스를 만듭니다.
  2. 실습에는 시간 제한이 있으며 일시중지 기능이 없습니다. 실습을 종료하면 처음부터 다시 시작해야 합니다.
  3. 화면 왼쪽 상단에서 실습 시작을 클릭하여 시작합니다.

시크릿 브라우징 사용

  1. 실습에 입력한 사용자 이름비밀번호를 복사합니다.
  2. 비공개 모드에서 콘솔 열기를 클릭합니다.

콘솔에 로그인

    실습 사용자 인증 정보를 사용하여
  1. 로그인합니다. 다른 사용자 인증 정보를 사용하면 오류가 발생하거나 요금이 부과될 수 있습니다.
  2. 약관에 동의하고 리소스 복구 페이지를 건너뜁니다.
  3. 실습을 완료했거나 다시 시작하려고 하는 경우가 아니면 실습 종료를 클릭하지 마세요. 이 버튼을 클릭하면 작업 내용이 지워지고 프로젝트가 삭제됩니다.

현재 이 콘텐츠를 이용할 수 없습니다

이용할 수 있게 되면 이메일로 알려드리겠습니다.

감사합니다

이용할 수 있게 되면 이메일로 알려드리겠습니다.

한 번에 실습 1개만 가능

모든 기존 실습을 종료하고 이 실습을 시작할지 확인하세요.

시크릿 브라우징을 사용하여 실습 실행하기

이 실습을 실행하는 가장 좋은 방법은 시크릿 모드 또는 시크릿 브라우저 창을 사용하는 것입니다. 개인 계정과 학생 계정 간의 충돌로 개인 계정에 추가 요금이 발생하는 일을 방지해 줍니다.