GSP514

Panoramica
In un Challenge Lab ti vengono presentati uno scenario e un insieme di attività. Anziché seguire le istruzioni passo passo, utilizzerai le competenze apprese dai lab durante il corso per capire come completare le attività autonomamente. Tramite un sistema di valutazione automatico (visibile in questa pagina), riceverai un feedback che ti consentirà di capire se hai completato le attività in modo corretto.
Quando partecipi a un Challenge Lab non ricevi alcuna formazione sui concetti di Google Cloud. Dovrai estendere le competenze che hai appreso, ad esempio modificare i valori predefiniti e leggere ed esaminare i messaggi di errore per correggere i tuoi errori.
Per ottenere un punteggio del 100% devi completare tutte le attività correttamente nel tempo stabilito.
Questo lab è consigliato per gli studenti che si sono iscritti al badge delle competenze Crea un mesh di dati con Dataplex. Accetti la sfida?
Configurazione e requisiti
Prima di fare clic sul pulsante Avvia lab
Leggi le seguenti istruzioni. I lab sono a tempo e non possono essere messi in pausa. Il timer si avvia quando fai clic su Inizia il lab e ti mostra per quanto tempo avrai a disposizione le risorse Google Cloud.
Con questo lab pratico avrai la possibilità di completare le attività in un ambiente cloud reale e non di simulazione o demo. Riceverai delle nuove credenziali temporanee che potrai utilizzare per accedere a Google Cloud per la durata del lab.
Per completare il lab, avrai bisogno di:
- Accesso a un browser internet standard (Chrome è il browser consigliato).
Nota: per eseguire questo lab, utilizza una finestra del browser in modalità di navigazione in incognito (consigliata) o privata. Ciò evita conflitti tra il tuo account personale e l'account studente, che potrebbero causare addebiti aggiuntivi sul tuo account personale.
- È ora di completare il lab: ricorda che, una volta iniziato, non puoi metterlo in pausa.
Nota: utilizza solo l'account studente per questo lab. Se utilizzi un altro account Google Cloud, potrebbero essere addebitati costi su quell'account.
Scenario della sfida
Hai appena iniziato a svolgere l'incarico di Junior Data Engineer. Finora hai aiutato i team a creare e gestire le risorse Dataplex.
Dovresti avere le competenze e le conoscenze necessarie per svolgere queste attività.
La sfida
Ti viene chiesto di aiutare un team di sviluppo appena formato a creare un nuovo mesh di dati utilizzando Dataplex. Nello specifico, dovrai creare un lake Dataplex con più zone e asset. Devi anche creare tipi di aspetti e aggiungere aspetti agli asset nel nuovo lake, nonché valutare la qualità dei dati. Ti viene chiesto di completare le seguenti attività:
- Creare un lake Dataplex con due zone e due asset.
- Creare un tipo di aspetto per i dati protetti e aggiungere un aspetto a una zona.
- Assegnare un ruolo IAM Dataplex a un altro utente.
- Creare e caricare un file di specifiche della qualità dei dati su Cloud Storage.
- Definire ed eseguire un job di qualità dei dati in Dataplex.
Alcuni standard che dovrai seguire:
- Assicurati che tutte le API necessarie (come Dataplex, Data Catalog e Dataproc) siano abilitate correttamente.
- Crea tutte le risorse nella regione , se non diversamente indicato.
Ogni attività è descritta dettagliatamente di seguito. In bocca al lupo!
Attività 1: crea un lake Dataplex con due zone e due asset
Nota: per tutte le attività di questo Challenge Lab, crea le risorse nella regione , se non diversamente indicato.
Il bucket Cloud Storage e il set di dati BigQuery per il passaggio 2 sono stati creati in precedenza in questo lab.
- Crea un lake Dataplex denominato Sales Lake con due zone a livello di regione:
- Una zona grezza denominata Raw Customer Zone
- Una zona curata denominata Curated Customer Zone
- Collega un asset creato in precedenza a ciascuna zona:
- Alla zona grezza, collega il bucket Cloud Storage denominato -customer-online-sessions come nuovo asset denominato Customer Engagements.
- Alla zona curata, collega il set di dati BigQuery denominato .customer_orders come nuovo asset denominato Customer Orders.
Suggerimento utile per la creazione di un lake Dataplex
Fai clic su Controlla i miei progressi per verificare l'obiettivo.
Crea un lake Dataplex con due zone e due asset
Attività 2: crea un tipo di aspetto e aggiungi un aspetto a una zona
- Crea un tipo di aspetto denominato Protected Customer Data Aspect con due campi enumerati:
- Il primo campo denominato Raw Data Flag con due valori: Yes e No.
- Il secondo campo denominato Protected Contact Information Flag con due valori: Yes e No.
- Aggiungi questo aspetto a Raw Customer Zone utilizzando il valore Yes per entrambi i flag.
Suggerimento utile per creare e applicare tipi di aspetto
Fai clic su Controlla i miei progressi per verificare l'obiettivo.
Crea un tipo di aspetto e aggiungi un aspetto a una zona
Attività 3: assegna un ruolo IAM Dataplex a un altro utente
- Utilizzando il principio del privilegio minimo, assegna il ruolo IAM Dataplex appropriato all'Utente 2 () che gli consente di caricare nuovi file di Cloud Storage nell'asset Dataplex denominata Customer Engagements.
Suggerimento utile per l'assegnazione dei ruoli IAM Dataplex
Fai clic su Controlla i miei progressi per verificare l'obiettivo.
Assegna un ruolo IAM Dataplex a un altro utente.
Attività 4: crea e carica un file di specifiche della qualità dei dati su Cloud Storage
Il bucket Cloud Storage per il passaggio 2 è stato creato in precedenza in questo lab.
- Crea un file di specifiche della qualità dei dati denominato dq-customer-orders.yaml con le seguenti specifiche:
- Regola NOT NULL applicata (con una soglia del 100%) alla colonna user_id della tabella customer_orders.ordered_items
- Regola NOT NULL applicata (con una soglia del 100%) alla colonna order_id della tabella customer_orders.ordered_items
- Tabella BigQuery di destinazione per i risultati: .orders_dq_dataset.results
- Carica il file nel bucket Cloud Storage denominato -dq-config.
Suggerimento utile per la creazione di file di specifiche della qualità dei dati
Fai clic su Controlla i miei progressi per verificare l'obiettivo.
Crea e carica un file di specifiche della qualità dei dati
Attività 5: Definisci ed esegui un job di qualità dei dati automatico in Dataplex
Il set di dati BigQuery per il passaggio 1 è stato creato in precedenza in questo lab.
- Definisci un job di qualità dei dati automatico utilizzando il file dq-customer-orders.yaml con le seguenti specifiche:
| Proprietà |
Valore |
| Nome job qualità dei dati |
customer-orders-data-quality-job |
| Dati di origine |
.customer_orders.ordered_items |
| Service account utente |
Service account predefinito Compute Engine |
- Esegui immediatamente il job di qualità dei dati automatico.
L'esecuzione del job può richiedere diversi minuti. Potresti dover aggiornare la pagina per verificare che il job sia stato eseguito correttamente.
Suggerimento utile per definire ed eseguire i job di qualità dei dati
Fai clic su Controlla i miei progressi per verificare l'obiettivo.
Definisci ed esegui un job di qualità dei dati in Dataplex
Complimenti!
Hai sviluppato un mesh di dati creando un lake Dataplex con più zone e asset, creando tipi di aspetto e aggiungendo aspetti agli asset e valutando la qualità dei dati.

Guadagna il tuo prossimo badge delle competenze
Questo self-paced lab fa parte del badge delle competenze Crea un mesh di dati con Dataplex. Il completamento di questo corso con badge delle competenze ti permette di ottenere il badge indicato in precedenza come riconoscimento per l'obiettivo raggiunto. Condividi il badge sul tuo CV e sulle piattaforme social e annuncia il risultato che hai raggiunto utilizzando #GoogleCloudBadge.
Questo corso con badge delle competenze fa parte del percorso di apprendimento Data Engineer di Google Cloud. Se hai già completato gli altri corsi con badge delle competenze in questo percorso di apprendimento, nel catalogo troverai altre Quest con badge delle competenze a cui iscriverti.
Formazione e certificazione Google Cloud
… per utilizzare al meglio le tecnologie Google Cloud. I nostri corsi ti consentono di sviluppare competenze tecniche e best practice per aiutarti a metterti subito al passo e avanzare nel tuo percorso di apprendimento. Offriamo vari livelli di formazione, dal livello base a quello avanzato, con opzioni di corsi on demand, dal vivo e virtuali, in modo da poter scegliere il più adatto in base ai tuoi impegni. Le certificazioni ti permettono di confermare e dimostrare le tue abilità e competenze relative alle tecnologie Google Cloud.
Ultimo aggiornamento del manuale: 04 settembre 2025
Ultimo test del lab: 04 settembre 2025
Copyright 2025 Google LLC. Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.