Senza l'infrastruttura e l'hardware giusti, archiviare enormi set di dati ed eseguirvi query può richiedere molto tempo e denaro. BigQuery è un data warehouse aziendale che risolve questo problema consentendo di eseguire query SQL rapidissime grazie alla potenza di elaborazione dell'infrastruttura Google. Non devi far altro che spostare i tuoi dati in BigQuery: ci occuperemo noi di tutto il resto. Puoi controllare l'accesso sia al progetto sia ai tuoi dati in base alle tue esigenze aziendali, ad esempio per offrire agli altri la possibilità di visualizzare i tuoi dati o eseguire query.
Puoi accedere a BigQuery utilizzando la console Cloud, lo strumento a riga di comando o chiamate all'API REST BigQuery tramite varie librerie client, tra cui Java, .NET o Python. Esistono anche numerosi strumenti di terze parti che puoi utilizzare per interagire con BigQuery, ad esempio per visualizzare o caricare i dati. In questo lab accederai a BigQuery utilizzando la UI web.
Puoi utilizzare la UI web di BigQuery nella console Cloud come interfaccia visiva per completare attività come l'esecuzione di query e il caricamento e l'esportazione di dati. Questo lab pratico mostra come eseguire query sulle tabelle in un set di dati pubblico e come caricare dati di esempio in BigQuery tramite la console Cloud.
Obiettivi
In questo lab imparerai a:
Eseguire una query su un set di dati pubblico.
Creare una tabella personalizzata.
Caricare i dati in una tabella.
Eseguire una query su una tabella.
Configura i tuoi ambienti
Configurazione del lab
Per ciascun lab, riceverai un nuovo progetto Google Cloud e un insieme di risorse per un periodo di tempo limitato senza alcun costo aggiuntivo.
Accedi a Qwiklabs utilizzando una finestra di navigazione in incognito.
Tieni presente la durata dell'accesso al lab (ad esempio, 1:15:00) e assicurati di finire entro quell'intervallo di tempo.
Non è disponibile una funzionalità di pausa. Se necessario, puoi riavviare il lab ma dovrai ricominciare dall'inizio.
Quando è tutto pronto, fai clic su Inizia lab.
Annota le tue credenziali del lab (Nome utente e Password). Le userai per accedere a Google Cloud Console.
Fai clic su Apri console Google.
Fai clic su Utilizza un altro account e copia/incolla le credenziali per questo lab nei prompt.
Se utilizzi altre credenziali, compariranno errori oppure ti verranno addebitati dei costi.
Accetta i termini e salta la pagina di ripristino delle risorse.
Apri la console di BigQuery
Nella console Google Cloud, seleziona Menu di navigazione > BigQuery.
Si aprirà la finestra con il messaggio Ti diamo il benvenuto in BigQuery nella console Cloud. Questa finestra fornisce un link alla guida rapida ed elenca gli aggiornamenti dell'interfaccia utente.
Fai clic su Fine.
Attività 1: esegui una query su un set di dati pubblico
In questa attività, caricherai un set di dati pubblico, usa_names, in BigQuery, quindi eseguirai una query sul set di dati per determinare i nomi più comuni negli Stati Uniti tra il 1910 e il 2013.
Carica il set di dati usa_names
Nel riquadro Explorer, in Digita per effettuare la ricerca, digita usa_names e premi Invio.
Fai clic su CERCA IN TUTTI I PROGETTI.
Nel riquadro Explorer, passa il puntatore del mouse sopra bigquery-public-data e fai clic su Aggiungi a Speciali.
Nel campo Digita per effettuare la ricerca, digita bigquery-public-data.
Verranno visualizzati tutti i set di dati nel progetto.
Nota: se il nuovo progetto bigquery-public-data non compare nel riquadro Explorer, fai clic su + AGGIUNGI DATI > Aggiungi un progetto a Speciali per nome > Avvia un progetto (bigquery-public-data) e AGGIUNGI A SPECIALI.
Fai clic su Espandi nodo per bigquery-public-data.
Scorri verso il basso l'elenco dei set di dati pubblici, fai clic su Altri risultati finché non trovi usa_names.
Fai clic su usa_names per espandere il set di dati.
Fai clic su usa_1910_2013 per aprire la tabella.
Esegui una query sul set di dati usa_names
Esegui una query bigquery-public-data.usa_names.usa_1910_2013 per trovare il nome e il sesso dei bambini in questo set di dati, quindi elenca i primi 10 nomi in ordine decrescente.
Fai clic su Query e seleziona In una nuova scheda.
Copia e incolla questa query nell'area di testo Editor di query, sostituendo la query esistente:
SELECT
name, gender,
SUM(number) AS total
FROM
`bigquery-public-data.usa_names.usa_1910_2013`
GROUP BY
name, gender
ORDER BY
total DESC
LIMIT
10
Nell'angolo in alto a destra della finestra, visualizza lo strumento di convalida delle query.
Se la query è valida, BigQuery mostra un'icona con un segno di spunta verde. Se la query non è valida, viene visualizzata un'icona rossa con punto esclamativo. Quando la query è valida, lo strumento di convalida mostra anche la quantità di dati elaborati dalla query quando la esegui. Ciò aiuta a determinare il costo di esecuzione della query.
Fai clic su Esegui.
I risultati della query vengono visualizzati sotto l'editor di query. Nella parte superiore della sezione Risultati delle query, BigQuery mostra il tempo trascorso e i dati elaborati dalla query. Sotto il tempo è disponibile la tabella che mostra i risultati della query. La riga di intestazione contiene il nome della colonna come specificato in GROUP BY nella query.
Attività 2: crea una tabella personalizzata
In questa attività, creerai una tabella personalizzata, vi caricherai i dati ed eseguirai una query sulla tabella.
Scarica i dati sul tuo computer locale
Il file che stai scaricando contiene circa 7 MB di dati relativi a nomi comuni di bambini, forniti dalla Social Security Administration degli Stati Uniti.
Scarica il file ZIP con i nomi dei bambini sul tuo computer locale.
Nota: se questo link di download non funziona, copia il file ZIP con i nomi dei bambini dalle risorse per gli studenti nel riquadro di sinistra della guida alle istruzioni.
Decomprimi il file sul tuo computer.
Apri il file denominato yob2014.txt per vedere come appaiono i dati. Si tratta di un file CSV (comma-separated values) con le seguenti tre colonne: nome, sesso (M o F) e numero di bambini con quel nome. Il file non ha una riga di intestazione.
Prendi nota della posizione del file yob2014.txt in modo da poterlo trovare in seguito.
Attività 3: crea un set di dati
In questa attività, creerai un set di dati per contenere la tua tabella, aggiungerai dati al tuo progetto, quindi creerai la tabella di dati su cui eseguirai la query.
I set di dati aiutano a controllare l'accesso alle tabelle e alle visualizzazioni in un progetto. Questo lab utilizza una sola tabella, ma è comunque necessario un set di dati per contenerla.
Torna alla console Cloud. Nel riquadro Explorer, cancella bigquery-public-data dalla casella Digita per effettuare la ricerca.
Nota: se hai utilizzato il metodo Aggiungi un progetto a Speciali per nome, quindi scorri di nuovo verso l'alto fino alla parte superiore dei risultati della ricerca.
Fai clic sul tuo ID progetto (inizia con qwiklabs).
Fai clic sui tre puntini accanto all'ID progetto e quindi su Crea set di dati.
Nella pagina Crea set di dati:
In ID set di dati, inserisci babynames.
In Località dei dati, scegli us (più regioni negli Stati Uniti).
In Scadenza tabella predefinita, lascia il valore predefinito.
In Crittografia, lascia il valore predefinito.
Fai clic su Crea set di dati nella parte inferiore del riquadro.
Attività 4: carica i dati in una nuova tabella
In questa attività, caricherai i dati nella tabella che hai creato.
Nel riquadro Explorer, espandi il set di dati del tuo ID progetto.
Fai clic sui tre punti accanto a babynames e quindi su Crea tabella.
Utilizza i valori predefiniti per tutte le impostazioni se non diversamente specificato.
Nella pagina Crea tabella:
Per Origine, dal menu a discesa Crea tabella da:, scegli Carica.
Per Seleziona file, fai clic su Sfoglia, vai al file yob2014.txt e fai clic su Apri.
Per Formato file, scegli CSV dal menu a discesa.
Per Nome tabella, inserisci names_2014.
Nella sezione Schema, fai clic sull'opzione di attivazione/disattivazione Modifica come testo e incolla la seguente definizione di schema nella casella di testo:
name:string,gender:string,count:integer
Fai clic su Crea tabella (nella parte inferiore della finestra).
Nota: se viene visualizzato un messaggio di errore di importazione, i tuoi dati dovrebbero essere comunque stati importati. Per eliminare l'errore, fai clic su Chiudi, quindi fai clic su Annulla per uscire dalla finestra di dialogo di importazione e infine fai clic su Sì, esci in risposta all'avviso che le modifiche non verranno salvate.
Visualizza l'anteprima della tabella
Nel riquadro Explorer, seleziona babynames > names_2014.
Nel riquadro dei dettagli, fai clic sulla scheda Anteprima.
Attività 5: esegui una query sulla tabella
Una volta caricati i dati, puoi eseguire query sulla tabella. La procedura è identica a quella dell'esempio precedente, ma ora devi eseguire una query sulla tua tabella, anziché su una tabella pubblica.
Nell'editor di query, fai clic su Crea query SQL.
Copia e incolla questa query in Editor di query. Questa query recupera i 5 nomi di bambini maschi statunitensi più popolari nel 2014.
Nota: il testo compreso tra i simboli ` e ` è sensibile alle maiuscole, quindi assicurati di usare i nomi esatti del set di dati e della tabella che hai creato.
SELECT
name, count
FROM
`babynames.names_2014`
WHERE
gender = 'M'
ORDER BY count DESC LIMIT 5
Fai clic su Esegui. I risultati vengono visualizzati sotto la finestra della query.
Complimenti!
Hai eseguito una query su un set di dati pubblico, quindi hai creato una tabella personalizzata, vi hai caricato i dati e quindi hai eseguito una query sulla tabella.
Termina il lab
Una volta completato il lab, fai clic su Termina lab. Google Cloud Skills Boost rimuove le risorse che hai utilizzato ed esegue la pulizia dell'account.
Avrai la possibilità di inserire una valutazione in merito alla tua esperienza. Seleziona il numero di stelle applicabile, inserisci un commento, quindi fai clic su Invia.
Il numero di stelle corrisponde alle seguenti valutazioni:
1 stella = molto insoddisfatto
2 stelle = insoddisfatto
3 stelle = esperienza neutra
4 stelle = soddisfatto
5 stelle = molto soddisfatto
Se non vuoi lasciare un feedback, chiudi la finestra di dialogo.
Per feedback, suggerimenti o correzioni, utilizza la scheda Assistenza.
Copyright 2020 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.
I lab creano un progetto e risorse Google Cloud per un periodo di tempo prestabilito
I lab hanno un limite di tempo e non possono essere messi in pausa. Se termini il lab, dovrai ricominciare dall'inizio.
In alto a sinistra dello schermo, fai clic su Inizia il lab per iniziare
Utilizza la navigazione privata
Copia il nome utente e la password forniti per il lab
Fai clic su Apri console in modalità privata
Accedi alla console
Accedi utilizzando le tue credenziali del lab. L'utilizzo di altre credenziali potrebbe causare errori oppure l'addebito di costi.
Accetta i termini e salta la pagina di ripristino delle risorse
Non fare clic su Termina lab a meno che tu non abbia terminato il lab o non voglia riavviarlo, perché il tuo lavoro verrà eliminato e il progetto verrà rimosso
Questi contenuti non sono al momento disponibili
Ti invieremo una notifica via email quando sarà disponibile
Bene.
Ti contatteremo via email non appena sarà disponibile
Un lab alla volta
Conferma per terminare tutti i lab esistenti e iniziare questo
Utilizza la navigazione privata per eseguire il lab
Utilizza una finestra del browser in incognito o privata per eseguire questo lab. In questo modo eviterai eventuali conflitti tra il tuo account personale e l'account Studente, che potrebbero causare addebiti aggiuntivi sul tuo account personale.
Vuoi analizzare set di dati di grandi dimensioni nel cloud? In questo lab di base utilizzerai BigQuery per caricare e analizzare un set di dati pubblico con SQL.
Durata:
Configurazione in 0 m
·
Accesso da 60 m
·
Completamento in 60 m