04
Como modernizar data lakes e data warehouses com o Google Cloud
04
Como modernizar data lakes e data warehouses com o Google Cloud
Os dois principais componentes de um pipeline de dados são data lakes e warehouses. Neste curso, destacamos os casos de uso para cada tipo de armazenamento e as soluções de data lake e warehouse disponíveis no Google Cloud de forma detalhada e técnica. Além disso, também descrevemos o papel de um engenheiro de dados, os benefícios de um pipeline de dados funcional para operações comerciais e analisamos por que a engenharia de dados deve ser feita em um ambiente de nuvem.
Este é o primeiro curso da série "Engenharia de dados no Google Cloud". Após a conclusão, recomendamos que você comece o curso "Como criar pipelines de dados em lote no Google Cloud".
- Diferenciar data lakes de data warehouses.
- Conhecer os casos de uso para cada tipo de armazenamento e as soluções de data lake e warehouse disponíveis no Google Cloud.
- Entender o papel de um engenheiro de dados e quais os benefícios de um pipeline de dados funcional para as operações comerciais.
- Analisar por que a engenharia de dados deve ser feita em um ambiente na nuvem.
Para aproveitar ao máximo este curso, os participantes devem ter concluído o "Fundamentos de Big Data e Machine Learning no Google Cloud" ou ter experiência equivalente. O participante também deve ter: • proficiência básica em linguagem de consulta comum, como SQL; • experiência com atividades de modelagem de dados e ETL (extração, transformação e carregamento); • experiência com desenvolvimento de aplicativos usando uma linguagem de programação comum, como Python; • conhecimento sobre machine learning e/ou estatística.