Course Path Icon Cours

Créer des pipelines de données en batch sur Google Cloud

4 heures Intermédiaire Mis à jour il y a environ 2 mois
Course Path Shape

Dans ce cours de niveau intermédiaire, vous apprendrez à concevoir, créer et optimiser des pipelines de données en batch robustes sur Google Cloud. Au-delà des bases de la gestion des données, vous explorerez les transformations de données à grande échelle et l'orchestration efficace des workflows, essentielles pour l'informatique décisionnelle et les rapports critiques.

Vous vous entraînerez à utiliser Dataflow pour Apache Beam et Serverless pour Apache Spark (Dataproc Serverless) pour l'implémentation, et vous aborderez des considérations importantes concernant la qualité des données, la surveillance et les alertes pour assurer la fiabilité des pipelines et l'excellence opérationnelle. Il est recommandé d'avoir des connaissances de base sur l'entreposage de données, les processus ETL/ELT, SQL, Python et les concepts de Google Cloud.

Gagnez un badge aujourd'hui !

La puissance des ateliers challenge

Vous pouvez désormais obtenir un badge de compétence sans avoir à suivre l'intégralité du cours. Si vous êtes sûr de vos compétences, passez directement à l'atelier challenge.

Aperçu