03
Creazione di sistemi di analisi dei flussi di dati resilienti su Google Cloud
03
Creazione di sistemi di analisi dei flussi di dati resilienti su Google Cloud
L'elaborazione dei flussi di dati sta diventando sempre più diffusa poiché la modalità flusso consente alle aziende di ottenere parametri in tempo reale sulle operazioni aziendali. Questo corso tratta la creazione di pipeline di dati in modalità flusso su Google Cloud. Pub/Sub viene presentato come strumento per la gestione dei flussi di dati in entrata. Il corso spiega anche come applicare aggregazioni e trasformazioni ai flussi di dati utilizzando Dataflow e come archiviare i record elaborati in BigQuery o Bigtable per l'analisi. Gli studenti acquisiranno esperienza pratica nella creazione di componenti della pipeline di dati in modalità flusso su Google Cloud utilizzando QwikLabs.
- Interpretare casi d'uso per l'analisi dei flussi di dati in tempo reale.
- Gestire eventi di dati utilizzando il servizio di messaggistica asincrono Pub/Sub.
- Scrivere pipeline di flusso ed eseguire trasformazioni quando necessario.
- Interagire con Dataflow, BigQuery e Pub/Sub per l'analisi e i flussi di dati in tempo reale.
Esperienza nell'analisi e nella visualizzazione di big data, nell'implementazione di soluzioni per big data basate su cloud e nella trasformazione/elaborazione di set di dati.
Concetti fondamentali di Google Cloud: big data e machine learning (o esperienza equivalente).
Alcune nozioni di Java.