Gisell Marcano
Date d'abonnement : 2023
Ligue de bronze
12045 points
Date d'abonnement : 2023
Ce cours est le premier d'une série en trois volets sur le traitement des données sans serveur avec Dataflow. Dans ce premier cours, nous allons commencer par rappeler ce qu'est Apache Beam et sa relation avec Dataflow. Ensuite, nous aborderons la vision d'Apache Beam et les avantages de son framework de portabilité, qui permet aux développeurs d'utiliser le langage de programmation et le backend d'exécution de leur choix. Nous vous montrerons aussi comment séparer le calcul du stockage et économiser de l'argent grâce à Dataflow, puis nous examinerons les interactions entre les outils de gestion de l'identification et des accès avec vos pipelines Dataflow. Enfin, nous verrons comment implémenter le modèle de sécurité adapté à votre cas d'utilisation sur Dataflow.
Terminez le cours intermédiaire Créer un entrepôt de données avec BigQuery pour recevoir un badge démontrant vos compétences dans les domaines suivants : la jointure de données pour créer des tables, la résolution des problèmes liés aux jointures, l'ajout de données avec des unions, la création de tables partitionnées par date, et l'utilisation d'objets JSON, ARRAY et STRUCT dans BigQuery.
Bien que les approches traditionnelles utilisant des lacs de données et des entrepôts de données puissent être efficaces, elles présentent des inconvénients, en particulier dans les grands environnements d'entreprise. Ce cours présente le concept de data lakehouse et les produits Google Cloud utilisés pour en créer un. Une architecture de lakehouse utilise des sources de données basées sur des normes ouvertes et combine les meilleures fonctionnalités des lacs et des entrepôts de données, ce qui permet de pallier de nombreuses lacunes.
Dans ce cours de niveau intermédiaire, vous apprendrez à concevoir, créer et optimiser des pipelines de données en batch robustes sur Google Cloud. Au-delà des bases de la gestion des données, vous explorerez les transformations de données à grande échelle et l'orchestration efficace des workflows, essentielles pour l'informatique décisionnelle et les rapports critiques. Vous vous entraînerez à utiliser Dataflow pour Apache Beam et Serverless pour Apache Spark (Dataproc Serverless) pour l'implémentation, et vous aborderez des considérations importantes concernant la qualité des données, la surveillance et les alertes pour assurer la fiabilité des pipelines et l'excellence opérationnelle. Il est recommandé d'avoir des connaissances de base sur l'entreposage de données, les processus ETL/ELT, SQL, Python et les concepts de Google Cloud.
Ce cours a pour objectif d'aider les participants à créer un plan de formation pour l'examen de certification Professional Data Engineer. Les participants découvriront l'étendue et le champ d'application des domaines abordés lors de l'examen, puis évalueront leur niveau de préparation à l'examen et créeront leur propre plan de formation.
De nombreuses entreprises traditionnelles utilisent d'anciens systèmes et d'anciennes applications qui ne peuvent plus satisfaire les attentes des clients d'aujourd'hui. Les chefs d'entreprise doivent régulièrement choisir entre deux options : entretenir leurs systèmes informatiques vieillissants ou investir dans de nouveaux produits et services. Le cours "Moderniser l'infrastructure et les applications avec Google Cloud" aborde ces problématiques et propose des solutions pour les résoudre à l'aide de la technologie cloud. Ce cours fait partie du parcours de formation Cloud Digital Leader. Il vise à aider les participants à évoluer dans leur poste et à bâtir l'avenir de leur entreprise.
La technologie cloud est une grande source de valeur pour les entreprises. En combinant le potentiel de cette technologie avec celui des données, il est possible de créer encore plus de valeur et d'offrir de nouvelles expériences client. "Explorer la transformation des données avec Google Cloud" vous fait découvrir la valeur que les données peuvent apporter à une entreprise et les façons dont Google Cloud peut les rendre utiles et accessibles. Ce cours fait partie du parcours de formation Cloud Digital Leader. Il a pour but d'aider les participants à évoluer dans leur poste et à façonner l'avenir de leur entreprise.
La technologie cloud et la transformation numérique suscitent beaucoup d'enthousiasme, mais elles génèrent aussi souvent beaucoup de questions laissées sans réponse. Par exemple : Qu'est-ce que la technologie cloud ? Qu'entend-on par transformation numérique ? Que peut vous apporter la technologie cloud ? Et par où commencer ? Si vous vous êtes déjà posé une de ces questions, vous êtes au bon endroit. Ce cours offre un aperçu des opportunités et des défis que les entreprises peuvent rencontrer lors de leur transformation numérique. Si vous souhaitez découvrir les technologies cloud afin de pouvoir exceller dans votre rôle et contribuer à bâtir l'avenir de votre entreprise, ce cours d'introduction sur la transformation numérique est pour vous. Il fait partie du parcours de formation Cloud Digital Leader.