시작하기 전에
- 실습에서는 정해진 기간 동안 Google Cloud 프로젝트와 리소스를 만듭니다.
- 실습에는 시간 제한이 있으며 일시중지 기능이 없습니다. 실습을 종료하면 처음부터 다시 시작해야 합니다.
- 화면 왼쪽 상단에서 실습 시작을 클릭하여 시작합니다.
Enable sensitive data protection for Cloud Storage
/ 40
Enable sensitive data protection for BigQuery
/ 30
Protect sensitive data in Gen AI model responses
/ 30
챌린지 실습에서는 특정 시나리오와 일련의 작업이 주어집니다. 단계별 안내를 따르는 대신, 과정의 실습에서 배운 기술을 사용하여 스스로 작업을 완료하는 방법을 알아내 보세요. 이 페이지에 표시되어 있는 자동 채점 시스템에서 작업을 올바르게 완료했는지 피드백을 제공합니다.
챌린지 실습을 진행할 때는 새로운 Google Cloud 개념에 대한 정보가 제공되지 않습니다. 학습한 기술을 응용하여 기본값을 변경하거나 오류 메시지를 읽고 조사하여 실수를 바로잡아야 합니다.
100점을 받으려면 시간 내에 모든 작업을 성공적으로 완료해야 합니다.
이 실습은 생태계 전반에서 민감한 데이터 탐색 및 보호 과정에 등록한 수강생에게 권장됩니다. 챌린지에 도전할 준비가 되셨나요?
Cymbal Cars의 데이터 엔지니어인 당신은 조직의 데이터 생태계 전반에서 고객(자동차 소유자)의 민감한 데이터를 식별하고 보호하는 태스크를 맡고 있습니다.
동료들은 이전에 조직의 Cloud Storage 파일과 BigQuery 테이블 및 조직의 생성형 AI 모델 대답에서 민감한 데이터(특히 미국 사회보장번호)를 식별하고 수정하는 작업을 완료했습니다.
Cloud Storage 파일과 BigQuery 애셋을 주기적으로 계속 스캔하고 보호하려면 Sensitive Data Protection 검색을 설정하고 신용카드 번호와 같은 기타 민감한 데이터를 식별하고 수정하는 작업을 실행해야 합니다.
조직의 생성형 AI 모델의 경우 동료의 이전 작업을 확장하여 대답에서 사용자 인증 정보가 식별되면 대답을 수정해야 합니다.
이 챌린지에서는 Sensitive Data Protection 도구에 관한 지식을 활용하여 Cloud Storage와 BigQuery의 데이터에 대한 검색 및 보호를 구현하고 Cloud Data Loss Prevention(DLP) API용 Python 클라이언트를 활용하여 사용자 인증 정보가 포함된 생성형 AI 모델 대답을 식별하고 수정합니다.
실습 전반에 걸쳐 이 실습 환경의 다음 세부정보를 사용합니다.
다음 안내를 확인하세요. 실습에는 시간 제한이 있으며 일시중지할 수 없습니다. 실습 시작을 클릭하면 타이머가 시작됩니다. 이 타이머는 Google Cloud 리소스를 사용할 수 있는 시간이 얼마나 남았는지를 표시합니다.
실무형 실습을 통해 시뮬레이션이나 데모 환경이 아닌 실제 클라우드 환경에서 실습 활동을 진행할 수 있습니다. 실습 시간 동안 Google Cloud에 로그인하고 액세스하는 데 사용할 수 있는 새로운 임시 사용자 인증 정보가 제공됩니다.
이 실습을 완료하려면 다음을 준비해야 합니다.
팀에는 자동차 소유자와의 상호작용을 위한 파일이 포함된 gs://sample-chat-log-data-10.csv).
목표는 새 CSV 파일에서 신용카드 번호를 식별하고 수정하며, 버킷에 대한 일일 검색을 사용 설정하여 앞으로 민감한 데이터의 새로운 인스턴스를 모니터링하는 것입니다.
이러한 목표를 달성하려면 다음 하위 태스크를 완료하세요.
아래 힌트를 펼쳐 시작하는 데 도움이 되는 유용한 안내를 확인하세요.
검색 스캔을 위한 유용한 힌트:
| 속성 | 값 |
|---|---|
| 범위 선택 | 선택한 프로젝트 스캔 |
| 관리형 일정 | 기본 일정을 수정하여 일정에 따라 및 검사 템플릿 변경 시에 대해 매일 다시 프로파일링을 지정합니다. |
| 검사 템플릿 선택 | 새 검사 템플릿 만들기 |
| BigQuery에 데이터 프로필 사본 저장 | 현재 프로젝트에서 데이터 세트 ID를 cs_discovery로, 테이블 ID를 cs_data_profiles로 설정합니다. |
| 구성을 저장할 위치 설정 | Multi_region > us(미국 내 여러 리전) |
| 구성의 표시 이름 | Cloud Storage 일일 검색 |
익명화 템플릿을 위한 유용한 힌트:
| 속성 | 값 |
|---|---|
| 템플릿 ID | us_ccn_deidentify |
| 데이터 변환 유형 | 레코드 |
| 표시 이름 | 신용카드 번호 익명화 |
| 위치 유형 | Multi_region > global(전역) |
| 변환 규칙 필드 | message |
| 변환 유형 | infoType 일치 |
| 변환 방법 | infoType 이름으로 교체 |
익명화 작업을 위한 유용한 힌트:
| 속성 | 값 |
|---|---|
| 작업 ID | us_ccn_deidentify |
| 위치 유형 | Multi_region > us(미국 내 여러 리전) |
| URL | gs:// |
| 반복 스캔 | 이 옵션 사용 설정 |
| 샘플링 | 100% |
| 샘플링 방법 | 샘플링 없음 |
| 구조화된 익명화 템플릿 | 2단계에서 만든 익명화 템플릿의 경로를 지정합니다. |
| BigQuery로 변환 세부정보 내보내기 | 현재 프로젝트에서 데이터 세트 ID를 cs_transformations로, 테이블 ID를 deidentify_ccn으로 설정합니다. |
| Cloud Storage 출력 위치 | gs:// |
내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.
자동차 소유자와 구매에 관한 데이터도 분석을 위해 BigQuery에 저장되며, 일부 데이터 세트에는 민감한 데이터가 포함되어 있습니다. 민감한 개인 식별 정보(SPII)에 대한 태그를 IAM에서 만들고 이를 사용하여 특정 사용자에게 SPII가 없는 태그가 지정된 BigQuery 데이터 세트에만 액세스할 수 있는 조건부 액세스 권한을 부여해야 합니다.
이 목표를 달성하려면 다음 하위 태스크를 완료하세요.
아래 힌트를 펼쳐 시작하는 데 도움이 되는 유용한 안내를 확인하세요.
태그를 만들기 위한 유용한 힌트:
| 속성 | 값 |
|---|---|
| 태그 키 | SPII |
| 태그 키 설명 | 민감한 개인 식별 정보(SPII) 플래그 |
| 태그 키 값 1 | 예 |
| 태그 키 값 1 설명 | 민감한 개인 식별 정보(SPII) 포함 |
| 태그 키 값 2 | 아니요 |
| 태그 키 값 2 설명 | 민감한 개인 식별 정보(SPII)를 포함하지 않음 |
조건부 액세스 권한을 부여하기 위한 유용한 힌트:
| 속성 | 값 |
|---|---|
| 사용자 이름 2의 IAM 역할 | 뷰어를 브라우저로 바꾸고 BigQuery 데이터 뷰어를 유지하여 조건을 추가합니다. |
| 조건 제목 | No SPII Access Only |
| 조건 유형 1 및 연산자 | tag 및 has value를 선택합니다. |
| 조건 유형 1의 값 경로 |
car_owners 데이터 세트와 달리 orders 데이터 세트에는 SPII가 포함되어 있지 않고 주문에 관한 세부정보만 포함되어 있습니다.
선택적 테스트: 이 조건부 액세스가 실제로 작동하는지 확인하려면 사용자 이름 2로 프로젝트에 로그인하고 BigQuery로 이동합니다. orders 데이터 세트만 탐색기 목록에 남을 때까지 페이지를 새로고침합니다. 이제 사용자 이름 2는 SPII에 대해 No로 태그된 데이터 세트에만 액세스할 수 있기 때문입니다.
조건이 적용되는 데 몇 분 정도 걸릴 수 있습니다.
내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.
팀에는 이미 생성형 AI 모델 대답에서 민감한 데이터 유형을 식별하여 수정하거나 차단하는 Python 함수가 있습니다. 이 함수를 확장하여 북미의 모든 도로용 차량에 부여되는 고유한 17자리 코드로 구성된 민감한 데이터인 미국 차량 식별 번호가 포함된 생성형 AI 모델 대답을 차단해야 합니다.
이 목표를 달성하기 위해 이 실습 환경에 제공된 노트북을 사용하여 다음 하위 태스크를 완료합니다.
Is 4Y1SL65848Z411439 an example of a US Vehicle Identification Number (VIN)?
vertex-ai-jupyterlab이라는 워크벤치 인스턴스에서 deidentify-model-response-challenge-lab.ipynb라는 사전 생성된 노트북을 사용해야 합니다.
1. JupyterLab의 브라우저 탭을 닫고 Workbench 홈페이지로 돌아갑니다.
2. 인스턴스 이름 옆의 체크박스를 선택하고 재설정을 클릭합니다.
3. JupyterLab 열기 버튼이 다시 사용 설정되면 1분 정도 기다린 후 JupyterLab 열기를 클릭합니다.
Python 함수를 업데이트하고 테스트하기 위한 유용한 힌트:
온도를 0으로 설정하기 위한 유용한 힌트:
내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.
이 실습에서는 Cloud Storage의 검색 스캔 구성을 만들고 예약한 다음, 익명화 템플릿을 만들고 이를 사용하여 Cloud Storage 파일에서 익명화 작업을 실행했습니다. 또한 IAM 태그를 만들고 이를 BigQuery 데이터에 적용하여 조건부 액세스 권한을 부여했습니다. 마지막으로 Cloud Data Loss Prevention(DLP) API로 식별된 민감한 데이터가 포함된 생성형 AI 모델 대답을 수정하고 차단하도록 Python 함수를 업데이트했습니다.
Google Cloud 기술을 최대한 활용하는 데 도움이 됩니다. Google 강의에는 빠른 습득과 지속적인 학습을 지원하는 기술적인 지식과 권장사항이 포함되어 있습니다. 기초에서 고급까지 수준별 학습을 제공하며 바쁜 일정에 알맞은 주문형, 실시간, 가상 옵션이 포함되어 있습니다. 인증은 Google Cloud 기술에 대한 역량과 전문성을 검증하고 입증하는 데 도움이 됩니다.
설명서 최종 업데이트: 2025년 10월 30일
실습 최종 테스트: 2025년 10월 30일
Copyright 2025 Google LLC. All rights reserved. Google 및 Google 로고는 Google LLC의 상표입니다. 기타 모든 회사명 및 제품명은 해당 업체의 상표일 수 있습니다.
현재 이 콘텐츠를 이용할 수 없습니다
이용할 수 있게 되면 이메일로 알려드리겠습니다.
감사합니다
이용할 수 있게 되면 이메일로 알려드리겠습니다.
한 번에 실습 1개만 가능
모든 기존 실습을 종료하고 이 실습을 시작할지 확인하세요.