가입 로그인

Bryan Au

회원 가입일: 2024

다이아몬드 리그

33975포인트
Serverless Data Processing with Dataflow: Operations Earned 2월 1, 2024 EST
Serverless Data Processing with Dataflow: Develop Pipelines Earned 1월 31, 2024 EST
Serverless Data Processing with Dataflow: Foundations Earned 1월 24, 2024 EST
Smart Analytics, Machine Learning, and AI on Google Cloud - 한국어 Earned 1월 24, 2024 EST
Google Cloud에서 스트리밍 데이터 파이프라인 빌드하기 Earned 1월 23, 2024 EST
Google Cloud에서 일괄 데이터 파이프라인 빌드하기 Earned 1월 22, 2024 EST
Google Cloud에서 데이터 레이크와 데이터 웨어하우스 빌드하기 Earned 1월 16, 2024 EST
Google Cloud Big Data and Machine Learning Fundamentals - 한국어 Earned 1월 15, 2024 EST
Preparing for your Professional Data Engineer Journey Earned 1월 12, 2024 EST
Looker에서 고급 LookML 개념 적용하기 Earned 1월 9, 2024 EST
Understanding LookML in Looker Earned 1월 9, 2024 EST
Looker에서 LookML 객체 빌드 Earned 1월 9, 2024 EST
Looker 대시보드 및 보고서를 위해 데이터 준비하기 Earned 1월 8, 2024 EST
Developing Data Models with LookML Earned 1월 8, 2024 EST
Analyzing and Visualizing Data in Looker Earned 1월 8, 2024 EST
Google Cloud 기반 데이터 분석 입문 Earned 1월 5, 2024 EST

In the last installment of the Dataflow course series, we will introduce the components of the Dataflow operational model. We will examine tools and techniques for troubleshooting and optimizing pipeline performance. We will then review testing, deployment, and reliability best practices for Dataflow pipelines. We will conclude with a review of Templates, which makes it easy to scale Dataflow pipelines to organizations with hundreds of users. These lessons will help ensure that your data platform is stable and resilient to unanticipated circumstances.

자세히 알아보기

In this second installment of the Dataflow course series, we are going to be diving deeper on developing pipelines using the Beam SDK. We start with a review of Apache Beam concepts. Next, we discuss processing streaming data using windows, watermarks and triggers. We then cover options for sources and sinks in your pipelines, schemas to express your structured data, and how to do stateful transformations using State and Timer APIs. We move onto reviewing best practices that help maximize your pipeline performance. Towards the end of the course, we introduce SQL and Dataframes to represent your business logic in Beam and how to iteratively develop pipelines using Beam notebooks.

자세히 알아보기

This course is part 1 of a 3-course series on Serverless Data Processing with Dataflow. In this first course, we start with a refresher of what Apache Beam is and its relationship with Dataflow. Next, we talk about the Apache Beam vision and the benefits of the Beam Portability framework. The Beam Portability framework achieves the vision that a developer can use their favorite programming language with their preferred execution backend. We then show you how Dataflow allows you to separate compute and storage while saving money, and how identity, access, and management tools interact with your Dataflow pipelines. Lastly, we look at how to implement the right security model for your use case on Dataflow.

자세히 알아보기

머신러닝을 데이터 파이프라인에 통합하면 데이터에서 더 많은 인사이트를 도출할 수 있습니다. 이 과정에서는 머신러닝을 Google Cloud의 데이터 파이프라인에 포함하는 방법을 알아봅니다. 맞춤설정이 거의 또는 전혀 필요 없는 경우에 적합한 AutoML에 대해 알아보고 맞춤형 머신러닝 기능이 필요한 경우를 위해 Notebooks 및 BigQuery 머신러닝(BigQuery ML)도 소개합니다. Vertex AI를 사용해 머신러닝 솔루션을 프로덕션화하는 방법도 다루어 보겠습니다.

자세히 알아보기

이 과정에서는 스트리밍 데이터 파이프라인을 빌드할 때 직면하는 실제 과제를 해결하기 위해 실습을 진행합니다. Google Cloud 제품을 사용하여 지속적이고 무제한적인 데이터를 관리하는 데 중점을 둡니다.

자세히 알아보기

이 중급 과정에서는 Google Cloud에서 강력한 일괄 데이터 파이프라인을 설계, 빌드, 최적화하는 방법을 알아봅니다. 기본적인 데이터 처리를 넘어, 시의적절한 비즈니스 인텔리전스와 중요한 보고에 필수적인 대규모 데이터 변환과 효율적인 워크플로 조정에 대해 살펴봅니다. Apache Beam용 Dataflow와 Apache Spark용 서버리스(Dataproc Serverless)를 사용하여 구현을 실습하고, 파이프라인 안정성과 운영 우수성을 보장하기 위해 데이터 품질, 모니터링, 알림에 대한 중요한 고려사항을 다룹니다. 데이터 웨어하우징, ETL/ELT, SQL, Python, Google Cloud 개념에 대한 기본적인 지식이 있으면 좋습니다.

자세히 알아보기

데이터 레이크와 데이터 웨어하우스를 사용하는 기존 접근방식은 효과적일 수 있지만, 특히 대규모 엔터프라이즈 환경에서는 단점이 있습니다. 이 과정에서는 데이터 레이크하우스의 개념과 데이터 레이크하우스를 만드는 데 사용되는 Google Cloud 제품을 소개합니다. 레이크하우스 아키텍처는 개방형 표준 데이터 소스를 사용하며 데이터 레이크와 데이터 웨어하우스의 장점을 결합하여 많은 단점을 해결합니다.

자세히 알아보기

이 과정에서는 데이터-AI 수명 주기를 지원하는 Google Cloud 빅데이터 및 머신러닝 제품과 서비스를 소개합니다. Google Cloud에서 Vertex AI를 사용하여 빅데이터 파이프라인 및 머신러닝 모델을 빌드하는 프로세스, 문제점 및 이점을 살펴봅니다.

자세히 알아보기

This course helps learners create a study plan for the PDE (Professional Data Engineer) certification exam. Learners explore the breadth and scope of the domains covered in the exam. Learners assess their exam readiness and create their individual study plan.

자세히 알아보기

이 과정에서는 Looker에서 고급 LookML 개념을 적용하는 실무를 직접 경험해 봅니다. Liquid를 사용하여 동적 측정기준과 측정항목을 맞춤설정 및 생성하고 동적 SQL 파생 테이블 및 맞춤설정된 기본 파생 테이블을 만들고 확장을 사용하여 LookML 코드를 모듈화하는 방법을 알아봅니다.

자세히 알아보기

In this quest, you will get hands-on experience with LookML in Looker. You will learn how to write LookML code to create new dimensions and measures, create derived tables and join them to Explores, filter Explores, and define caching policies in LookML.

자세히 알아보기

초급 Looker에서 LookML 객체 빌드 기술 배지 과정을 완료하여 새로운 측정기준 및 측정값, 뷰, 파생 테이블을 빌드하고, 요구사항에 따라 측정 필터 및 유형을 설정하고, 측정기준과 측정값을 업데이트하고, Explore를 빌드 및 미세 조정하고, 기존 Explore에 뷰를 조인하고, 비즈니스 요구사항에 따라 생성할 LookML 객체를 결정하는 기술 역량을 입증할 수 있습니다.

자세히 알아보기

초급 Looker 대시보드 및 보고서를 위해 데이터 준비하기 기술 배지 과정을 완료하면 데이터를 필터링, 정렬, 피벗팅하고, 다른 Looker Explore의 결과를 병합하고, 함수 및 연산자를 사용해 데이터 분석 및 시각화를 위한 Looker 대시보드 및 보고서를 빌드하는 기술 역량을 입증할 수 있습니다.

자세히 알아보기

This course empowers you to develop scalable, performant LookML (Looker Modeling Language) models that provide your business users with the standardized, ready-to-use data that they need to answer their questions. Upon completing this course, you will be able to start building and maintaining LookML models to curate and manage data in your organization’s Looker instance.

자세히 알아보기

In this course, you learn how to do the kind of data exploration and analysis in Looker that would formerly be done primarily by SQL developers or analysts. Upon completion of this course, you will be able to leverage Looker's modern analytics platform to find and explore relevant content in your organization’s Looker instance, ask questions of your data, create new metrics as needed, and build and share visualizations and dashboards to facilitate data-driven decision making.

자세히 알아보기

초급 과정에서는 Google Cloud에서 데이터 분석 워크플로와 데이터를 탐색, 분석, 시각화하여 이해관계자와 결과물을 공유하는 데 활용할 수 있는 도구에 대해 학습합니다. 이 과정에서는 우수사례를 실무형 실습, 강의, 퀴즈/데모와 함께 활용해 원시 데이터 세트에서 데이터를 정리하여 효과적인 시각화 및 대시보드를 만드는 방법을 설명합니다. 이미 데이터를 활용하고 있고 Google Cloud를 효과적으로 활용하는 방법을 알고 싶거나 경력을 발전시키고 싶은 학습자라면 이 과정으로 학습을 시작해 보세요. 업무에서 데이터 분석을 수행하거나 활용하는 거의 모든 학습자에게 도움이 될 수 있습니다.

자세히 알아보기