가입 로그인

JAVIER TORIBIO SILVA

회원 가입일: 2024

Serverless Data Processing with Dataflow: Operations Earned 11월 25, 2025 EST
Dataflow를 사용한 서버리스 데이터 처리: 기초 Earned 9월 30, 2025 EDT
Google Cloud에서 스트리밍 데이터 파이프라인 빌드하기 Earned 9월 29, 2025 EDT
Google Cloud에서 일괄 데이터 파이프라인 빌드하기 Earned 9월 23, 2025 EDT
Google Cloud에서 데이터 레이크와 데이터 웨어하우스 빌드하기 Earned 9월 16, 2025 EDT
Google Cloud의 데이터 엔지니어링 입문 Earned 9월 9, 2025 EDT
Preparing for your Professional Data Engineer Journey Earned 8월 20, 2025 EDT

In the last installment of the Dataflow course series, we will introduce the components of the Dataflow operational model. We will examine tools and techniques for troubleshooting and optimizing pipeline performance. We will then review testing, deployment, and reliability best practices for Dataflow pipelines. We will conclude with a review of Templates, which makes it easy to scale Dataflow pipelines to organizations with hundreds of users. These lessons will help ensure that your data platform is stable and resilient to unanticipated circumstances.

자세히 알아보기

이 과정은 Dataflow를 사용한 서버리스 데이터 처리에 관한 3개 과정으로 이루어진 시리즈 중 1부입니다. 이 첫 번째 과정에서는 Apache Beam이 무엇인지, Dataflow와 어떤 관계가 있는지 복습하는 내용으로 시작합니다. 다음으로 Apache Beam의 비전과 Beam 이식성 프레임워크의 이점에 대해 설명합니다. Beam 이식성 프레임워크는 개발자가 선호하는 프로그래밍 언어를 원하는 실행 백엔드와 함께 사용할 수 있다는 비전을 실현합니다. 그런 다음 Dataflow를 통해 컴퓨팅과 스토리지를 분리하면서 비용을 절감하는 방법과 ID, 액세스, 관리 도구가 Dataflow 파이프라인과 상호작용하는 방식을 알아봅니다. 마지막으로 Dataflow에서 사용 사례에 맞는 적절한 보안 모델을 구현하는 방법을 살펴봅니다.

자세히 알아보기

이 과정에서는 스트리밍 데이터 파이프라인을 빌드할 때 직면하는 실제 과제를 해결하기 위해 실습을 진행합니다. Google Cloud 제품을 사용하여 지속적이고 무제한적인 데이터를 관리하는 데 중점을 둡니다.

자세히 알아보기

이 중급 과정에서는 Google Cloud에서 강력한 일괄 데이터 파이프라인을 설계, 빌드, 최적화하는 방법을 알아봅니다. 기본적인 데이터 처리를 넘어, 시의적절한 비즈니스 인텔리전스와 중요한 보고에 필수적인 대규모 데이터 변환과 효율적인 워크플로 조정에 대해 살펴봅니다. Apache Beam용 Dataflow와 Apache Spark용 서버리스(Dataproc Serverless)를 사용하여 구현을 실습하고, 파이프라인 안정성과 운영 우수성을 보장하기 위해 데이터 품질, 모니터링, 알림에 대한 중요한 고려사항을 다룹니다. 데이터 웨어하우징, ETL/ELT, SQL, Python, Google Cloud 개념에 대한 기본적인 지식이 있으면 좋습니다.

자세히 알아보기

데이터 레이크와 데이터 웨어하우스를 사용하는 기존 접근방식은 효과적일 수 있지만, 특히 대규모 엔터프라이즈 환경에서는 단점이 있습니다. 이 과정에서는 데이터 레이크하우스의 개념과 데이터 레이크하우스를 만드는 데 사용되는 Google Cloud 제품을 소개합니다. 레이크하우스 아키텍처는 개방형 표준 데이터 소스를 사용하며 데이터 레이크와 데이터 웨어하우스의 장점을 결합하여 많은 단점을 해결합니다.

자세히 알아보기

이 과정에서는 Google Cloud의 데이터 엔지니어링, 데이터 엔지니어의 역할과 책임, 그리고 이러한 요소가 Google Cloud 제공 서비스와 어떻게 연결되는지에 대해 알아봅니다. 또한 데이터 엔지니어링 과제를 해결하는 방법에 대해서도 배우게 됩니다.

자세히 알아보기

This course helps learners create a study plan for the PDE (Professional Data Engineer) certification exam. Learners explore the breadth and scope of the domains covered in the exam. Learners assess their exam readiness and create their individual study plan.

자세히 알아보기