실습 설정 안내 및 요구사항

계정과 진행 상황을 보호하세요. 이 실습을 실행하려면 항상 시크릿 브라우저 창과 실습 사용자 인증 정보를 사용하세요.

생태계 전반에서 민감한 데이터 탐색 및 보호: 챌린지 실습

실습 30분 universal_currency_alt 크레딧 5개 show_chart 중급

info 이 실습에는 학습을 지원하는 AI 도구가 통합되어 있을 수 있습니다.

GSP522
개요
챌린지 시나리오
설정 및 요건
태스크 1. Cloud Storage에 Sensitive Data Protection 사용 설정
태스크 2. BigQuery에 Sensitive Data Protection 사용 설정
태스크 3. 생성형 AI 모델 대답에서 민감한 데이터 보호
수고하셨습니다

이 콘텐츠는 아직 휴대기기에 최적화되지 않음

최상의 경험을 위해 데스크톱 컴퓨터에서 이메일로 전송된 링크를 사용하여 방문하세요.

GSP522

Google Cloud 사용자 주도형 실습 로고

개요

챌린지 실습에서는 특정 시나리오와 일련의 작업이 주어집니다. 단계별 안내를 따르는 대신, 과정의 실습에서 배운 기술을 사용하여 스스로 작업을 완료하는 방법을 알아내 보세요. 이 페이지에 표시되어 있는 자동 채점 시스템에서 작업을 올바르게 완료했는지 피드백을 제공합니다.

챌린지 실습을 진행할 때는 새로운 Google Cloud 개념에 대한 정보가 제공되지 않습니다. 학습한 기술을 응용하여 기본값을 변경하거나 오류 메시지를 읽고 조사하여 실수를 바로잡아야 합니다.

100점을 받으려면 시간 내에 모든 작업을 성공적으로 완료해야 합니다.

이 실습은 생태계 전반에서 민감한 데이터 탐색 및 보호 과정에 등록한 수강생에게 권장됩니다. 챌린지에 도전할 준비가 되셨나요?

챌린지 시나리오

Cymbal Cars의 데이터 엔지니어인 당신은 조직의 데이터 생태계 전반에서 고객(자동차 소유자)의 민감한 데이터를 식별하고 보호하는 태스크를 맡고 있습니다.

동료들은 이전에 조직의 Cloud Storage 파일과 BigQuery 테이블 및 조직의 생성형 AI 모델 대답에서 민감한 데이터(특히 미국 사회보장번호)를 식별하고 수정하는 작업을 완료했습니다.

Cloud Storage 파일과 BigQuery 애셋을 주기적으로 계속 스캔하고 보호하려면 Sensitive Data Protection 검색을 설정하고 신용카드 번호와 같은 기타 민감한 데이터를 식별하고 수정하는 작업을 실행해야 합니다.

조직의 생성형 AI 모델의 경우 동료의 이전 작업을 확장하여 대답에서 사용자 인증 정보가 식별되면 대답을 수정해야 합니다.

이 챌린지에서는 Sensitive Data Protection 도구에 관한 지식을 활용하여 Cloud Storage와 BigQuery의 데이터에 대한 검색 및 보호를 구현하고 Cloud Data Loss Prevention(DLP) API용 Python 클라이언트를 활용하여 사용자 인증 정보가 포함된 생성형 AI 모델 대답을 식별하고 수정합니다.

테스트 주제

Cloud Storage의 검색 스캔 구성 만들기 및 예약
익명화 템플릿 만들기 및 Cloud Storage 파일에서 익명화 작업 실행
민감한 데이터에 대한 IAM 태그 만들기 및 이를 BigQuery 데이터에 적용하여 조건부 액세스 권한 부여
Cloud Data Loss Prevention(DLP) API로 식별된 민감한 데이터를 포함하는 생성형 AI 모델 대답을 수정하고 차단하는 Python 함수 작성

설정 및 요건

실습 전반에 걸쳐 이 실습 환경의 다음 세부정보를 사용합니다.

사용자 이름 1()로 Google Cloud 콘솔에 로그인합니다.
프로젝트 ID에 을(를) 사용합니다.
위치에 을(를) 사용합니다(별도로 지정되지 않은 경우).

실습 시작 버튼을 클릭하기 전에

다음 안내를 확인하세요. 실습에는 시간 제한이 있으며 일시중지할 수 없습니다. 실습 시작을 클릭하면 타이머가 시작됩니다. 이 타이머는 Google Cloud 리소스를 사용할 수 있는 시간이 얼마나 남았는지를 표시합니다.

실무형 실습을 통해 시뮬레이션이나 데모 환경이 아닌 실제 클라우드 환경에서 실습 활동을 진행할 수 있습니다. 실습 시간 동안 Google Cloud에 로그인하고 액세스하는 데 사용할 수 있는 새로운 임시 사용자 인증 정보가 제공됩니다.

이 실습을 완료하려면 다음을 준비해야 합니다.

표준 인터넷 브라우저 액세스 권한(Chrome 브라우저 권장)

참고: 이 실습을 실행하려면 시크릿 모드(권장) 또는 시크릿 브라우저 창을 사용하세요. 개인 계정과 학습자 계정 간의 충돌로 개인 계정에 추가 요금이 발생하는 일을 방지해 줍니다.

실습을 완료하기에 충분한 시간(실습을 시작하고 나면 일시중지할 수 없음)

참고: 이 실습에는 학습자 계정만 사용하세요. 다른 Google Cloud 계정을 사용하는 경우 해당 계정에 비용이 청구될 수 있습니다.

태스크 1. Cloud Storage에 Sensitive Data Protection 사용 설정

팀에는 자동차 소유자와의 상호작용을 위한 파일이 포함된 gs://-car-owners라는 Cloud Storage 버킷이 있습니다. 이러한 파일 대부분은 이미 동료가 민감한 데이터를 수정했지만 버킷에 추가된 일부 새로운 CSV 파일(.csv)에는 신용카드 번호가 포함되어 있습니다(예: sample-chat-log-data-10.csv).

목표는 새 CSV 파일에서 신용카드 번호를 식별하고 수정하며, 버킷에 대한 일일 검색을 사용 설정하여 앞으로 민감한 데이터의 새로운 인스턴스를 모니터링하는 것입니다.

이러한 목표를 달성하려면 다음 하위 태스크를 완료하세요.

아래 힌트를 펼쳐 시작하는 데 도움이 되는 유용한 안내를 확인하세요.

Cloud Storage에 대해 매일 실행되는 검색 스캔 구성 만들기 및 예약

검색 스캔을 위한 유용한 힌트:

속성	값
범위 선택	선택한 프로젝트 스캔
관리형 일정	기본 일정을 수정하여 일정에 따라 및 검사 템플릿 변경 시에 대해 매일 다시 프로파일링을 지정합니다.
검사 템플릿 선택	새 검사 템플릿 만들기
BigQuery에 데이터 프로필 사본 저장	현재 프로젝트에서 데이터 세트 ID를 cs_discovery로, 테이블 ID를 cs_data_profiles로 설정합니다.
구성을 저장할 위치 설정	Multi_region > us(미국 내 여러 리전)
구성의 표시 이름	Cloud Storage 일일 검색

CSV 파일과 같은 정형 데이터에서 신용카드 번호를 수정하는 익명화 템플릿 만들기

익명화 템플릿을 위한 유용한 힌트:

속성	값
템플릿 ID	us_ccn_deidentify
데이터 변환 유형	레코드
표시 이름	신용카드 번호 익명화
위치 유형	Multi_region > global(전역)
변환 규칙 필드	message
변환 유형	infoType 일치
변환 방법	infoType 이름으로 교체

익명화 템플릿을 사용하여 Cloud Storage 버킷의 CSV 파일에 대해 익명화 작업 실행

익명화 작업을 위한 유용한 힌트:

속성	값
작업 ID	us_ccn_deidentify
위치 유형	Multi_region > us(미국 내 여러 리전)
URL	gs://-car-owners/
반복 스캔	이 옵션 사용 설정
샘플링	100%
샘플링 방법	샘플링 없음
구조화된 익명화 템플릿	2단계에서 만든 익명화 템플릿의 경로를 지정합니다.
BigQuery로 변환 세부정보 내보내기	현재 프로젝트에서 데이터 세트 ID를 cs_transformations로, 테이블 ID를 deidentify_ccn으로 설정합니다.
Cloud Storage 출력 위치	gs://-car-owners-transformed

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. Cloud Storage에 Sensitive Data Protection 사용 설정

태스크 2. BigQuery에 Sensitive Data Protection 사용 설정

자동차 소유자와 구매에 관한 데이터도 분석을 위해 BigQuery에 저장되며, 일부 데이터 세트에는 민감한 데이터가 포함되어 있습니다. 민감한 개인 식별 정보(SPII)에 대한 태그를 IAM에서 만들고 이를 사용하여 특정 사용자에게 SPII가 없는 태그가 지정된 BigQuery 데이터 세트에만 액세스할 수 있는 조건부 액세스 권한을 부여해야 합니다.

이 목표를 달성하려면 다음 하위 태스크를 완료하세요.

아래 힌트를 펼쳐 시작하는 데 도움이 되는 유용한 안내를 확인하세요.

IAM에서 민감한 개인 식별 정보(SPII)에 대한 태그 만들기

태그를 만들기 위한 유용한 힌트:

속성	값
태그 키	SPII
태그 키 설명	민감한 개인 식별 정보(SPII) 플래그
태그 키 값 1	예
태그 키 값 1 설명	민감한 개인 식별 정보(SPII) 포함
태그 키 값 2	아니요
태그 키 값 2 설명	민감한 개인 식별 정보(SPII)를 포함하지 않음

SPII 없음 태그가 있는 BigQuery 데이터 세트에만 조건부로 액세스하도록 사용자 이름 2에 권한 부여

조건부 액세스 권한을 부여하기 위한 유용한 힌트:

사용자 이름 2()의 IAM 설정을 업데이트하여 조건(특히 SPII에 대해 No 값으로 태그된 BigQuery 데이터 세트에만 액세스)을 추가합니다.

속성	값
사용자 이름 2의 IAM 역할	뷰어를 브라우저로 바꾸고 BigQuery 데이터 뷰어를 유지하여 조건을 추가합니다.
조건 제목	No SPII Access Only
조건 유형 1 및 연산자	tag 및 has value를 선택합니다.
조건 유형 1의 값 경로	/SPII/No

orders라는 BigQuery 데이터 세트에 SPII의 값으로 No를 태그합니다.

car_owners 데이터 세트와 달리 orders 데이터 세트에는 SPII가 포함되어 있지 않고 주문에 관한 세부정보만 포함되어 있습니다.

선택적 테스트: 이 조건부 액세스가 실제로 작동하는지 확인하려면 사용자 이름 2로 프로젝트에 로그인하고 BigQuery로 이동합니다. orders 데이터 세트만 탐색기 목록에 남을 때까지 페이지를 새로고침합니다. 이제 사용자 이름 2는 SPII에 대해 No로 태그된 데이터 세트에만 액세스할 수 있기 때문입니다.

조건이 적용되는 데 몇 분 정도 걸릴 수 있습니다.

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. BigQuery에 Sensitive Data Protection 사용 설정

태스크 3. 생성형 AI 모델 대답에서 민감한 데이터 보호

팀에는 이미 생성형 AI 모델 대답에서 민감한 데이터 유형을 식별하여 수정하거나 차단하는 Python 함수가 있습니다. 이 함수를 확장하여 북미의 모든 도로용 차량에 부여되는 고유한 17자리 코드로 구성된 민감한 데이터인 미국 차량 식별 번호가 포함된 생성형 AI 모델 대답을 차단해야 합니다.

이 목표를 달성하기 위해 이 실습 환경에 제공된 노트북을 사용하여 다음 하위 태스크를 완료합니다.

미국 차량 식별 번호가 포함된 경우 모델 대답을 차단하도록 기존 Python 함수를 업데이트합니다.
다음 프롬프트 예시 텍스트를 생성하여 업데이트된 함수를 테스트합니다. Is 4Y1SL65848Z411439 an example of a US Vehicle Identification Number (VIN)?
- 대답을 생성할 때 온도를 0으로 설정하여 아래의 진행 상황 확인에서 확률이 가장 높은 결과가 반환되도록 합니다.

vertex-ai-jupyterlab이라는 워크벤치 인스턴스에서 deidentify-model-response-challenge-lab.ipynb라는 사전 생성된 노트북을 사용해야 합니다.

프로젝트 ID에 을(를) 사용합니다.
위치에 을(를) 사용합니다.

참고: JupyterLab에 노트북이 표시되지 않는다면 다음 추가 단계에 따라 인스턴스를 재설정하세요.

1. JupyterLab의 브라우저 탭을 닫고 Workbench 홈페이지로 돌아갑니다.

2. 인스턴스 이름 옆의 체크박스를 선택하고 재설정을 클릭합니다.

3. JupyterLab 열기 버튼이 다시 사용 설정되면 1분 정도 기다린 후 JupyterLab 열기를 클릭합니다.

Python 함수를 업데이트하고 테스트하기 위한 유용한 힌트:

온도를 0으로 설정하기 위한 유용한 힌트:

내 진행 상황 확인하기를 클릭하여 목표를 확인합니다. 생성형 AI 모델 대답에서 민감한 데이터 보호

수고하셨습니다

이 실습에서는 Cloud Storage의 검색 스캔 구성을 만들고 예약한 다음, 익명화 템플릿을 만들고 이를 사용하여 Cloud Storage 파일에서 익명화 작업을 실행했습니다. 또한 IAM 태그를 만들고 이를 BigQuery 데이터에 적용하여 조건부 액세스 권한을 부여했습니다. 마지막으로 Cloud Data Loss Prevention(DLP) API로 식별된 민감한 데이터가 포함된 생성형 AI 모델 대답을 수정하고 차단하도록 Python 함수를 업데이트했습니다.

생태계 전반에서 민감한 데이터 탐색 및 보호 기술 배지

Google Cloud 교육 및 자격증

Google Cloud 기술을 최대한 활용하는 데 도움이 됩니다. Google 강의에는 빠른 습득과 지속적인 학습을 지원하는 기술적인 지식과 권장사항이 포함되어 있습니다. 기초에서 고급까지 수준별 학습을 제공하며 바쁜 일정에 알맞은 주문형, 실시간, 가상 옵션이 포함되어 있습니다. 인증은 Google Cloud 기술에 대한 역량과 전문성을 검증하고 입증하는 데 도움이 됩니다.

설명서 최종 업데이트: 2025년 10월 30일

실습 최종 테스트: 2025년 10월 30일

생태계 전반에서 민감한 데이터 탐색 및 보호: 챌린지 실습

GSP522

개요

챌린지 시나리오

테스트 주제

설정 및 요건

실습 시작 버튼을 클릭하기 전에

태스크 1. Cloud Storage에 Sensitive Data Protection 사용 설정

Cloud Storage에 대해 매일 실행되는 검색 스캔 구성 만들기 및 예약

CSV 파일과 같은 정형 데이터에서 신용카드 번호를 수정하는 익명화 템플릿 만들기

익명화 템플릿을 사용하여 Cloud Storage 버킷의 CSV 파일에 대해 익명화 작업 실행

태스크 2. BigQuery에 Sensitive Data Protection 사용 설정

IAM에서 민감한 개인 식별 정보(SPII)에 대한 태그 만들기

SPII 없음 태그가 있는 BigQuery 데이터 세트에만 조건부로 액세스하도록 사용자 이름 2에 권한 부여

태스크 3. 생성형 AI 모델 대답에서 민감한 데이터 보호

수고하셨습니다

Google Cloud 교육 및 자격증

시작하기 전에

시크릿 브라우징 사용

콘솔에 로그인

시크릿 브라우징을 사용하여 실습 실행하기