Course Path Icon Course

Processamento de dados sem servidor com o Dataflow: desenvolvimento de pipelines

21 horas Avançado
Course Path Shape

Na segunda parte desta série, vamos nos aprofundar no desenvolvimento de pipelines usando o SDK do Beam. Primeiro, vamos conferir um resumo dos conceitos do Apache Beam. Depois disso, falaremos sobre como processar dados de streaming usando janelas, marcas d’água e gatilhos. Em seguida, vamos ver as opções de origens e coletores para seus pipelines, além de esquemas para expressar seus dados estruturados e como fazer transformações com estado usando as APIs State e Timer. A próxima tarefa será conferir as práticas recomendadas para maximizar o desempenho do pipeline. No final do curso, apresentaremos as APIs SQL e Dataframes, que representam sua lógica de negócios no Beam. Além disso, veremos como desenvolver pipelines de maneira iterativa usando os notebooks do Beam.

Ganhe um selo hoje mesmo!

O poder dos laboratórios com desafio

Agora você pode receber um selo de habilidade de forma mais rápida, sem precisar fazer o curso inteiro. Se você confia a nas suas habilidades, vá direto para o laboratório com desafio.

Visualizar