개요
이 실습에서는 BigQuery를 사용하여 결제 데이터를 분석하는 방법을 알아봅니다.
목표
이 실습에서는 다음 작업을 수행하는 방법을 알아봅니다.
- Cloud 콘솔에서 BigQuery에 로그인
- 데이터 세트 만들기
- 테이블 만들기
- 버킷에 저장된 결제 파일에서 데이터 가져오기
- 대규모 데이터 세트에서 복잡한 쿼리 실행
설정 및 요건
각 실습에서는 정해진 기간 동안 새 Google Cloud 프로젝트와 리소스 집합이 무료로 제공됩니다.
-
실습 시작 버튼을 클릭합니다. 실습 비용을 결제해야 하는 경우 결제 수단을 선택할 수 있는 팝업이 열립니다.
왼쪽에는 다음과 같은 항목이 포함된 실습 세부정보 패널이 있습니다.
-
Google Cloud 콘솔 열기 버튼
- 남은 시간
- 이 실습에 사용해야 하는 임시 사용자 인증 정보
- 필요한 경우 실습 진행을 위한 기타 정보
-
Google Cloud 콘솔 열기를 클릭합니다(Chrome 브라우저를 실행 중인 경우 마우스 오른쪽 버튼으로 클릭하고 시크릿 창에서 링크 열기를 선택합니다).
실습에서 리소스가 가동되면 다른 탭이 열리고 로그인 페이지가 표시됩니다.
팁: 두 개의 탭을 각각 별도의 창으로 나란히 정렬하세요.
참고: 계정 선택 대화상자가 표시되면 다른 계정 사용을 클릭합니다.
-
필요한 경우 아래의 사용자 이름을 복사하여 로그인 대화상자에 붙여넣습니다.
{{{user_0.username | "Username"}}}
실습 세부정보 패널에서도 사용자 이름을 확인할 수 있습니다.
-
다음을 클릭합니다.
-
아래의 비밀번호를 복사하여 시작하기 대화상자에 붙여넣습니다.
{{{user_0.password | "Password"}}}
실습 세부정보 패널에서도 비밀번호를 확인할 수 있습니다.
-
다음을 클릭합니다.
중요: 실습에서 제공하는 사용자 인증 정보를 사용해야 합니다. Google Cloud 계정 사용자 인증 정보를 사용하지 마세요.
참고: 이 실습에 자신의 Google Cloud 계정을 사용하면 추가 요금이 발생할 수 있습니다.
-
이후에 표시되는 페이지를 클릭하여 넘깁니다.
- 이용약관에 동의합니다.
- 임시 계정이므로 복구 옵션이나 2단계 인증을 추가하지 않습니다.
- 무료 체험판을 신청하지 않습니다.
잠시 후 Google Cloud 콘솔이 이 탭에서 열립니다.
참고: Google Cloud 제품 및 서비스 목록이 있는 메뉴를 보려면 왼쪽 상단의 탐색 메뉴를 클릭하거나 검색창에 제품 또는 서비스 이름을 입력합니다.
작업 1. BigQuery를 사용하여 데이터 가져오기
BigQuery에 로그인하고 데이터 세트 만들기
이 작업에서는 BigQuery를 사용하여 데이터 세트를 만듭니다. 그런 다음 테이블을 만들고 Cloud Storage에서 마지막으로 결제 데이터를 가져옵니다.
- Google Cloud 콘솔의 탐색 메뉴(
)에서 BigQuery를 클릭합니다.
- 메시지가 표시되면 완료를 클릭합니다.
-
프로젝트 ID(qwiklabs-gcp로 시작) 옆에 있는 작업 보기 아이콘을 클릭하고 데이터 세트 만들기를 클릭합니다.
참고: Cloud Billing 데이터를 BigQuery로 내보내기 가이드에 설명된 대로 결제 데이터를 BigQuery로 직접 내보낼 수 있습니다. 이 실습에서는 준비된 샘플 결제 파일을 사용합니다. 이 파일은 학생 계정으로 액세스할 수 있는 Cloud Storage 버킷에 위치합니다. 이 결제 정보를 BigQuery 테이블로 가져와서 검토합니다.
- 다음 사항을 지정합니다.
| 속성 |
값(지정된 값 입력 또는 옵션 선택) |
| 데이터 세트 ID: |
billing_dataset |
| 데이터 위치: |
US |
| 기본 테이블 만료(테이블 만료 사용 설정 선택): |
1일(기본 최대 테이블 기간) |
-
데이터 세트 만들기를 클릭합니다. 왼쪽 창에 billing_dataset가 표시됩니다.
테이블 만들기 및 가져오기
-
billing_dataset 데이터 세트 옆에 있는 작업 보기 아이콘을 클릭하고 열기를 클릭한 다음 테이블 만들기를 클릭하여 새 테이블을 만듭니다.
-
소스의 경우 다음을 지정하고 나머지 설정은 기본값으로 둡니다.
| 속성 |
값(지정된 값 입력 또는 옵션 선택) |
| 테이블을 만들 소스: |
Google Cloud Storage |
| GCS 버킷에서 파일 선택 |
cloud-training/archinfra/BillingExport-2020-09-18.avro |
| 파일 형식 |
Avro |
-
대상의 경우 다음을 지정하고 나머지 설정은 기본값으로 둡니다.
| 속성 |
값(지정된 값 입력 또는 옵션 선택) |
| 테이블 이름 |
sampleinfotable |
| 테이블 유형 |
기본 테이블 |
-
테이블 만들기를 클릭합니다.
작업이 완료되면 왼쪽 창의 데이터 세트 아래에 테이블이 나타납니다.
내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.
BigQuery를 사용하여 데이터 가져오기
작업 2. 테이블 검토하기
이 작업에서는 가져온 데이터를 검토합니다.
-
sampleinfotable을 클릭합니다.
참고: 가져온 파일에서 찾은 데이터를 기반으로 BigQuery가 자동 생성한 스키마가 표시됩니다. 문자열, 정수, 타임스탬프, 부동 소수점 값이 있습니다.
-
세부정보를 클릭합니다.
행 수를 확인합니다.
-
미리보기 탭을 클릭합니다.
작업 3. 간단한 쿼리 작성하기
이 작업에서는 간단한 쿼리를 작성하고 실행하여 결제 데이터를 필터링합니다.
쿼리에서 테이블을 참조할 때 데이터 세트 ID와 테이블 ID를 모두 지정해야 합니다. 프로젝트 ID는 선택사항입니다.
참고: 프로젝트 ID를 지정하지 않으면 BigQuery는 현재 프로젝트를 기본적으로 사용합니다.
필요한 모든 정보는 BigQuery 인터페이스에서 찾을 수 있습니다. 왼쪽 열에 데이터 세트 ID(billing_dataset)와 테이블 ID(sampleinfotable)가 표시됩니다.
테이블 이름을 클릭하면 모든 필드 이름과 함께 스키마가 나타납니다.
이제 비용 필드를 기반으로 간단한 쿼리를 구성합니다.
-
+ SQL 쿼리를 클릭합니다.
- 쿼리 편집기에 다음을 붙여넣습니다.
SELECT * FROM `billing_dataset.sampleinfotable`
WHERE Cost > 0
-
실행을 클릭합니다.
내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.
간단한 쿼리 작성
작업 4. SQL을 사용하여 대규모 결제 데이터 세트 분석하기
이 작업에서는 BigQuery를 사용하여 415,602개의 결제 데이터 행이 있는 샘플 데이터 세트를 분석합니다.
- 새 쿼리를 작성하기 위해 쿼리 편집기에 다음을 붙여넣습니다.
SELECT
billing_account_id,
project.id,
project.name,
service.description,
currency,
currency_conversion_rate,
cost,
usage.amount,
usage.pricing_unit
FROM
`billing_dataset.sampleinfotable`
-
실행을 클릭합니다.
결과 테이블에 결제 데이터 행 415,602개가 있는지 확인합니다.
-
쿼리 편집기에 다음을 붙여넣어 요금(비용 > 0)이 발생한 최근 100개의 레코드를 찾는 새 쿼리를 작성합니다.
SELECT
service.description,
sku.description,
location.country,
cost,
project.id,
project.name,
currency,
currency_conversion_rate,
usage.amount,
usage.unit
FROM
`billing_dataset.sampleinfotable`
WHERE
Cost > 0
ORDER BY usage_end_time DESC
LIMIT 100
-
실행을 클릭합니다.
- 쿼리 편집기에 다음을 붙여넣어 10달러가 넘는 모든 요금을 찾는 새 쿼리를 작성합니다.
SELECT
service.description,
sku.description,
location.country,
cost,
project.id,
project.name,
currency,
currency_conversion_rate,
usage.amount,
usage.unit
FROM
`billing_dataset.sampleinfotable`
WHERE
cost > 10
-
실행을 클릭합니다.
-
결제 데이터에서 가장 많은 레코드가 있는 제품을 찾기 위한 새 쿼리를 작성하려면 쿼리 편집기에 다음을 붙여넣습니다.
SELECT
service.description,
COUNT(*) AS billing_records
FROM
`billing_dataset.sampleinfotable`
GROUP BY
service.description
ORDER BY billing_records DESC
-
실행을 클릭합니다.
- 비용이 1달러를 넘고 가장 자주 사용된 제품을 찾기 위한 새 쿼리를 작성하려면 쿼리 편집기에 다음을 붙여넣습니다.
SELECT
service.description,
COUNT(*) AS billing_records
FROM
`billing_dataset.sampleinfotable`
WHERE
cost > 1
GROUP BY
service.description
ORDER BY
billing_records DESC
-
실행을 클릭합니다.
- 가장 일반적으로 청구되는 측정 단위를 찾기 위한 새 쿼리를 작성하려면 쿼리 편집기에 다음을 붙여넣습니다.
SELECT
usage.unit,
COUNT(*) AS billing_records
FROM
`billing_dataset.sampleinfotable`
WHERE cost > 0
GROUP BY
usage.unit
ORDER BY
billing_records DESC
-
실행을 클릭합니다.
- 합산 비용이 가장 높은 제품을 찾기 위한 새 쿼리를 작성하려면 쿼리 편집기에 다음을 붙여넣습니다.
SELECT
service.description,
ROUND(SUM(cost),2) AS total_cost
FROM
`billing_dataset.sampleinfotable`
GROUP BY
service.description
ORDER BY
total_cost DESC
-
실행을 클릭합니다.
내 진행 상황 확인하기를 클릭하여 목표를 확인합니다.
SQL을 사용하여 대규모 결제 데이터 세트 분석
작업 5. 검토
이 실습에서는 avro 파일로 생성된 결제 데이터를 BigQuery로 가져왔습니다. 이 파일에 대해 간단한 쿼리를 실행했습니다. 그런 다음 22,000개 이상의 결제 정보 레코드가 포함된 공유 데이터 세트에 액세스했습니다. 해당 데이터에 대해 다양한 쿼리를 실행하여 질의응답에 BigQuery를 사용하는 방법을 알아봤습니다.
실습 종료하기
실습을 완료하면 실습 종료를 클릭합니다. Google Cloud Skills Boost에서 사용된 리소스를 자동으로 삭제하고 계정을 지웁니다.
실습 경험을 평가할 수 있습니다. 해당하는 별표 수를 선택하고 의견을 입력한 후 제출을 클릭합니다.
별점의 의미는 다음과 같습니다.
- 별표 1개 = 매우 불만족
- 별표 2개 = 불만족
- 별표 3개 = 중간
- 별표 4개 = 만족
- 별표 5개 = 매우 만족
의견을 제공하고 싶지 않다면 대화상자를 닫으면 됩니다.
의견이나 제안 또는 수정할 사항이 있다면 지원 탭을 사용하세요.
Copyright 2026 Google LLC All rights reserved. Google 및 Google 로고는 Google LLC의 상표입니다. 기타 모든 회사명 및 제품명은 해당 업체의 상표일 수 있습니다.