Course

Processamento de dados sem servidor com o Dataflow: desenvolvimento de pipelines

Name: Processamento de dados sem servidor com o Dataflow: desenvolvimento de pipelines
Rating: 3.27 (11 reviews)

21 horas Avançado

Na segunda parte desta série, vamos nos aprofundar no desenvolvimento de pipelines usando o SDK do Beam. Primeiro, vamos conferir um resumo dos conceitos do Apache Beam. Depois disso, falaremos sobre como processar dados de streaming usando janelas, marcas d’água e gatilhos. Em seguida, vamos ver as opções de origens e coletores para seus pipelines, além de esquemas para expressar seus dados estruturados e como fazer transformações com estado usando as APIs State e Timer. A próxima tarefa será conferir as práticas recomendadas para maximizar o desempenho do pipeline. No final do curso, apresentaremos as APIs SQL e Dataframes, que representam sua lógica de negócios no Beam. Além disso, veremos como desenvolver pipelines de maneira iterativa usando os notebooks do Beam.

Ganhe um selo hoje mesmo!

Processamento de dados sem servidor com o Dataflow: desenvolvimento de pipelines

O poder dos laboratórios com desafio