Istruzioni e requisiti di configurazione del lab

Proteggi il tuo account e i tuoi progressi. Per eseguire questo lab, utilizza sempre una finestra del browser privata e le credenziali del lab.

Utilizzo di BigQuery ML per prevedere il peso dei pinguini

Lab 2 ore universal_currency_alt 5 crediti show_chart Avanzati

info Questo lab potrebbe incorporare strumenti di AI a supporto del tuo apprendimento.

Panoramica
Configurazione
Attività 1: crea il tuo set di dati
Attività 2: crea il tuo modello
Attività 3: ottieni le statistiche di addestramento (attività facoltativa)
Attività 4: valuta il modello
Attività 5: usa il tuo modello per prevedere i risultati
Attività 6: spiega i risultati della previsione con metodi IA spiegabili
Attività 7: spiega il tuo modello a livello globale (attività facoltativa)
Attività 8: esegui la pulizia
Complimenti!
Terminare il lab

Questi contenuti non sono ancora ottimizzati per i dispositivi mobili.

Per un'esperienza ottimale, visualizza il sito su un computer utilizzando un link inviato via email.

Panoramica

In questo lab utilizzerai la tabella relativa ai pinguini per creare un modello che preveda il peso di un pinguino in base alla specie, all'isola su cui vive, alla lunghezza e alle profondità del culmen, alla lunghezza delle pinne e al sesso.

Questo lab introduce BigQuery ML agli analisti di dati. BigQuery ML consente agli utenti di creare ed eseguire modelli di machine learning in BigQuery utilizzando query SQL. L'obiettivo è democratizzare il machine learning consentendo a chi utilizza SQL di creare modelli con i propri strumenti esistenti e aumentare la velocità di sviluppo attraverso l'eliminazione della necessità di spostare i dati.

Obiettivi di apprendimento

Creare un modello di regressione lineare utilizzando l'istruzione CREATE MODEL con BigQuery ML.
Valutare il modello ML con la funzione ML.EVALUATE.
Effettuare previsioni utilizzando il modello ML con la funzione ML.PREDICT.

Configurazione

Per ciascun lab, riceverai un nuovo progetto Google Cloud e un insieme di risorse per un periodo di tempo limitato senza alcun costo aggiuntivo.

Accedi a Google Skills utilizzando una finestra Incognito.
Tieni presente la durata dell'accesso al lab (ad esempio, 1:15:00) e assicurati di finire entro quell'intervallo di tempo.
Non è disponibile una funzionalità di pausa. Se necessario, puoi riavviare il lab ma dovrai ricominciare dall'inizio.
Quando è tutto pronto, fai clic su Inizia lab.
Annota le tue credenziali del lab (Nome utente e Password). Le userai per accedere a Google Cloud Console.
Fai clic su Apri console Google.
Fai clic su Utilizza un altro account e copia/incolla le credenziali per questo lab nei prompt.
Se utilizzi altre credenziali, compariranno errori oppure ti verranno addebitati dei costi.
Accetta i termini e salta la pagina di ripristino delle risorse.

Abilita l'API BigQuery

Nella console Cloud, nel menu di navigazione (), fai clic su API e servizi > Libreria.
Cerca API BigQuery, quindi fai clic su Abilita se non è già abilitata.

Attività 1: crea il tuo set di dati

Il primo passaggio prevede di creare un set di dati BigQuery per archiviare il tuo modello ML. Per creare il set di dati:

Nella console Cloud, nel menu di navigazione, fai clic su BigQuery.
Nel riquadro Explorer, fai clic sull'icona Visualizza azioni (tre puntini verticali) accanto al tuo ID progetto, quindi fai clic su Crea set di dati.
Nella pagina Crea set di dati:

Per ID set di dati, digita bqml_tutorial
(Facoltativo) Per Località dei dati, seleziona USA (più regioni negli Stati Uniti).
Attualmente, i set di dati pubblici sono archiviati nella località Stati Uniti (più regioni). Per semplicità, dovresti inserire il tuo set di dati nella stessa località.

Non modificare le altre impostazioni predefinite e fai clic su Crea set di dati.

Attività 2: crea il tuo modello

Ora creerai un modello di regressione lineare utilizzando la tabella penguins per BigQuery.

La seguente query SQL standard viene utilizzata per creare il modello che utilizzerai per prevedere il peso di un pinguino:

#standardSQL CREATE OR REPLACE MODEL `bqml_tutorial.penguins_model` OPTIONS (model_type='linear_reg', input_label_cols=['body_mass_g']) AS SELECT * FROM `bigquery-public-data.ml_datasets.penguins` WHERE body_mass_g IS NOT NULL

Oltre a creare il modello, il comando CREATE MODEL addestra il modello creato.

Dettagli query

La clausola CREATE MODEL viene utilizzata per creare e addestrare il modello denominato bqml_tutorial.penguins_model.

La clausola OPTIONS(model_type='linear_reg', input_label_cols=['body_mass_g']) indica che stai creando un modello di regressione lineare. Una regressione lineare è un tipo di modello di regressione che genera un valore continuo da una combinazione lineare di caratteristiche di input. La colonna body_mass_g è la colonna dell'etichetta di input. Per i modelli di regressione lineare, la colonna dell'etichetta deve avere valori reali (i valori della colonna devono essere numeri reali).

L'istruzione SELECT di questa query utilizza tutte le colonne della tabella bigquery-public-data.ml_datasets.penguins. Questa tabella contiene le seguenti colonne che verranno tutte utilizzate per prevedere il peso di un pinguino:

species: specie del pinguino (STRING)
island: isola su cui vive il pinguino (STRING)
culmen_length_mm: lunghezza del culmen in millimetri (FLOAT64)
culmen_depth_mm: profondità del culmen in millimetri (FLOAT64)
flipper_length_mm: lunghezza delle pinne in millimetri (FLOAT64)
sex: il sesso del pinguino (STRING)

La clausola FROM, bigquery-public-data.ml_datasets.penguins, indica che stai eseguendo query sulla tabella penguins nel set di dati ml_datasets. Questo set di dati si trova nel progetto bigquery-public-data.

La clausola WHERE, WHERE body_mass_g IS NOT NULL, esclude le righe in cui body_mass_g è NULL.

Esegui la query CREATE MODEL

Per eseguire la query CREATE MODEL in modo da creare e addestrare il modello:

Nella console Cloud, fai clic su Crea nuova query.
Nell'area di testo Editor query, immetti la seguente query SQL standard:

Fai clic su Esegui.

Il completamento della query richiede circa 30 secondi, dopodiché il tuo modello (penguins_model) verrà visualizzato nel pannello di navigazione. Poiché la query utilizza un'istruzione CREATE MODEL per creare una tabella, non vengono visualizzati i risultati della query.

Nota: puoi ignorare l'avviso relativo ai valori NULL per i dati di input.

Attività 3: ottieni le statistiche di addestramento (attività facoltativa)

Per visualizzare i risultati dell'addestramento del modello, puoi utilizzare la funzione ML.TRAINING_INFO, altrimenti puoi visualizzare le statistiche nella console Cloud. In questo tutorial utilizzi la console Cloud.

Un algoritmo di machine learning crea un modello esaminando molti esempi e tentando di trovare un modello che minimizzi la perdita. Questo processo è noto come minimizzazione empirica del rischio.

La perdita è la penalità per una previsione errata: un numero che indica quanto fosse negativa la previsione del modello su un singolo esempio. Se la previsione del modello è perfetta, la perdita è zero; in caso contrario, la perdita è maggiore. L'obiettivo dell'addestramento di un modello è trovare un insieme di ponderazioni e bias che presentino, in media, una perdita lieve in tutti gli esempi.

Per visualizzare le statistiche di addestramento del modello generate durante l'esecuzione della query CREATE MODEL:

Nel pannello di navigazione della console Cloud, nella sezione Explorer, espandi [PROJECT_ID] > bqml_tutorial > Models (1), quindi fai clic su penguins_model.
Fai clic sulla scheda Addestramento e quindi su Tabella. I risultati dovrebbero essere simili ai seguenti:

Modello penguins_model in formato tabella nella pagina con schede Addestramento

La colonna Perdita di dati di addestramento rappresenta la metrica relativa alla perdita calcolata dopo che il modello è stato addestrato sul set di dati di addestramento. Poiché hai eseguito una regressione lineare, questa colonna rappresenta l'errore quadratico medio.

Per questo addestramento viene utilizzata automaticamente una strategia di ottimizzazione "normal_equation", pertanto è necessaria una sola iterazione per convergere al modello finale. Per maggiori dettagli sull'opzione optimize_strategy, fai riferimento all'istruzione CREATE MODEL per i modelli lineari generalizzati.

Per maggiori dettagli sulla funzione ML.TRAINING_INFO e sull'opzione di addestramento "optimize_strategy", vedi il riferimento per la sintassi di BigQuery ML.

Attività 4: valuta il modello

Dopo aver creato il tuo modello, valuterai le prestazioni del modello utilizzando la funzione ML.EVALUATE. La funzione ML.EVALUATE valuta i valori previsti rispetto ai dati effettivi.

Per valutare il modello viene utilizzata la seguente query:

#standardSQL SELECT * FROM ML.EVALUATE(MODEL `bqml_tutorial.penguins_model`, ( SELECT * FROM `bigquery-public-data.ml_datasets.penguins` WHERE body_mass_g IS NOT NULL))

Dettagli query

La prima istruzione SELECT recupera le colonne dal modello.
La clausola FROM utilizza la funzione ML.EVALUATE rispetto al tuo modello: bqml_tutorial.penguins_model.
L'istruzione SELECT e la clausola FROM nidificate di questa query sono le stesse della query CREATE MODEL.
La clausola WHERE, WHERE body_mass_g IS NOT NULL, esclude le righe in cui body_mass_g è NULL.

Una valutazione corretta andrebbe eseguita su un sottoinsieme della tabella penguins separato dai dati utilizzati per addestrare il modello. Puoi possibile chiamare ML.EVALUATE senza fornire dati di input. ML.EVALUATE recupererà le metriche di valutazione calcolate durante l'addestramento, che utilizza il set di dati di valutazione riservato automaticamente:

#standardSQL SELECT * FROM ML.EVALUATE(MODEL `bqml_tutorial.penguins_model`)

Puoi anche utilizzare la console Cloud per visualizzare le metriche di valutazione calcolate durante l'addestramento. I risultati dovrebbero essere simili ai seguenti:

Pagina con schede Valutazione di Penguins_model che mostra l'errore assoluto medio, l'errore quadratico medio, l'errore logaritmico quadratico medio, l'errore mediano assoluto e i dettagli R al quadrato

Esegui la query ML.EVALUATE

Per eseguire la query ML.EVALUATE che valuta il modello:

Nella console Cloud, fai clic su Crea nuova query.
Nell'area di testo Editor query, immetti la seguente query SQL standard:

#standardSQL SELECT * FROM ML.EVALUATE(MODEL `bqml_tutorial.penguins_model`, ( SELECT * FROM `bigquery-public-data.ml_datasets.penguins` WHERE body_mass_g IS NOT NULL))

(Facoltativo) Per impostare la località dei dati, fai clic su Altro > Impostazioni query. Per Località dei dati, seleziona USA (più regioni negli Stati Uniti).
Fai clic su Esegui.
Una volta completata la query, fai clic sulla scheda Risultati sotto l'area di testo della query. I risultati dovrebbero essere simili ai seguenti:

Risultati della query

Poiché hai eseguito una regressione lineare, i risultati includono le seguenti colonne:

mean_absolute_error
mean_squared_error
mean_squared_log_error
median_absolute_error
r2_score
explained_variance

Una metrica importante nei risultati della valutazione è il coefficiente R². Il coefficiente R² è una misura statistica che determina se le previsioni della regressione lineare si avvicinano ai dati effettivi. 0 indica che il modello non spiega nessuna delle variabilità dei dati di risposta attorno alla media. 1 indica che il modello spiega tutte le variabilità dei dati di risposta attorno alla media.

Attività 5: usa il tuo modello per prevedere i risultati

Ora che hai valutato il modello, il passaggio successivo consiste nell'utilizzarlo per prevedere un risultato. Utilizzerai il tuo modello per prevedere la massa corporea in grammi di tutti i pinguini che vivono sull'isola di Biscoe.

Per prevedere il risultato, viene utilizzata la seguente query:

#standardSQL SELECT * FROM ML.PREDICT(MODEL `bqml_tutorial.penguins_model`, ( SELECT * FROM `bigquery-public-data.ml_datasets.penguins` WHERE body_mass_g IS NOT NULL AND island = "Biscoe"))

Dettagli query

La prima istruzione SELECT recupera la colonna predicted_body_mass_g insieme alle colonne in bigquery-public-data.ml_datasets.penguins. Questa colonna viene generata dalla funzione ML.PREDICT. Quando utilizzi la funzione ML.PREDICT, il nome della colonna di output per il modello è predicted_<label_column_name>. Per i modelli di regressione lineare, predicted_label è il valore stimato di label. Per i modelli di regressione logistica, predicted_label è una delle due etichette di input a seconda di quale etichetta ha la probabilità prevista più elevata.

La funzione ML.PREDICT viene utilizzata per prevedere i risultati mediante il modello bqml_tutorial.penguins_model.
L'istruzione SELECT e la clausola FROM nidificate di questa query sono le stesse della query CREATE MODEL.
La clausola WHERE, WHERE island = "Biscoe", indica che stai limitando la previsione all'isola di Biscoe.

Esegui la query ML.PREDICT

Per eseguire la query che utilizza il modello per prevedere un risultato:

Nella console Cloud, fai clic su Crea nuova query.
Nell'area di testo Editor query, immetti la seguente query SQL standard:

#standardSQL SELECT * FROM ML.PREDICT(MODEL `bqml_tutorial.penguins_model`, ( SELECT * FROM `bigquery-public-data.ml_datasets.penguins` WHERE body_mass_g IS NOT NULL AND island = "Biscoe"))

(Facoltativo) Per impostare la località dei dati, fai clic su Altro > Impostazioni query. Per Località dei dati, seleziona USA (più regioni negli Stati Uniti).
Fai clic su Esegui.
Una volta completata la query, fai clic sulla scheda Risultati sotto l'area di testo della query. I risultati dovrebbero essere simili ai seguenti:

Pagina Risultati delle query che mostra 11 righe di dati

Attività 6: spiega i risultati della previsione con metodi IA spiegabili

Per capire perché il tuo modello sta generando questi risultati di previsione, puoi utilizzare la funzione ML.EXPLAIN_PREDICT.

ML.EXPLAIN_PREDICT è una versione estesa di ML.PREDICT. ML.EXPLAIN_PREDICT restituisce i risultati della previsione con colonne aggiuntive che ne spiegano il significato.

Puoi eseguire ML.EXPLAIN_PREDICT senza ML.PREDICT. Per una spiegazione approfondita dei valori di Shapley e dell'IA spiegabile in BigQuery ML, consulta Panoramica di BigQuery Explainable AI.

Per generare spiegazioni, viene utilizzata la seguente query:

#standardSQL SELECT * FROM ML.EXPLAIN_PREDICT(MODEL `bqml_tutorial.penguins_model`, ( SELECT * FROM `bigquery-public-data.ml_datasets.penguins` WHERE body_mass_g IS NOT NULL AND island = "Biscoe"), STRUCT(3 as top_k_features))

Dettagli query

Esegui la query ML.EXPLAIN_PREDICT

Per eseguire la query ML.EXPLAIN_PREDICT che spiega il modello:

Nella console Cloud, fai clic su Crea nuova query.
Nell'area di testo Editor query, immetti la seguente query SQL standard:

Fai clic su Esegui.
Una volta completata la query, fai clic sulla scheda Risultati sotto l'area di testo della query. I risultati dovrebbero essere simili ai seguenti:

Pagina Risultati delle query

Nota: la query ML.EXPLAIN_PREDICT restituisce tutte le colonne delle caratteristiche di input, in modo analogo alla query ML.PREDICT. Nella figura sopra viene mostrata solo una colonna di caratteristiche, "species", per motivi di leggibilità.

Per i modelli di regressione lineare, vengono utilizzati i valori di Shapley per generare valori di attribuzione di caratteristiche per ogni caratteristica nel modello. ML.EXPLAIN_PREDICT restituisce le prime 3 attribuzioni di caratteristiche per riga della tabella fornita perché top_k_features è stato impostato su 3 nella query.

Queste attribuzioni sono ordinate in base al valore assoluto dell'attribuzione in ordine decrescente. In tutti gli esempi, la caratteristica sex ha contribuito maggiormente alla previsione complessiva. Per spiegazioni dettagliate sulle colonne di output della query ML.EXPLAIN_PREDICT, consulta la documentazione sulla sintassi ML.EXPLAIN_PREDICT.

Attività 7: spiega il tuo modello a livello globale (attività facoltativa)

Per sapere quali caratteristiche sono le più importanti per determinare i pesi dei pinguini in generale, puoi utilizzare la funzione ML.GLOBAL_EXPLAIN. Per utilizzare ML.GLOBAL_EXPLAIN, il modello deve essere riaddestrato con l'opzione ENABLE_GLOBAL_EXPLAIN=TRUE.

Esegui nuovamente la query di addestramento con questa opzione utilizzando la query seguente:

#standardSQL CREATE OR REPLACE MODEL bqml_tutorial.penguins_model OPTIONS (model_type='linear_reg', input_label_cols=['body_mass_g'], enable_global_explain=TRUE) AS SELECT * FROM `bigquery-public-data.ml_datasets.penguins` WHERE body_mass_g IS NOT NULL

Nota: puoi ignorare l'avviso relativo ai valori NULL per i dati di input.

Accedi alle spiegazioni globali mediante ML.GLOBAL_EXPLAIN

Per generare spiegazioni globali, viene utilizzata la seguente query:

#standardSQL SELECT * FROM ML.GLOBAL_EXPLAIN(MODEL `bqml_tutorial.penguins_model`)

Dettagli query

Esegui la query ML.GLOBAL_EXPLAIN

Per eseguire la query ML.GLOBAL_EXPLAIN:

Nella console Cloud, fai clic su Crea nuova query.
Nell'area di testo Editor query, immetti la seguente query SQL standard:

#standardSQL SELECT * FROM ML.GLOBAL_EXPLAIN(MODEL `bqml_tutorial.penguins_model`)

(Facoltativo) Per impostare la località dei dati, fai clic su Altro > Impostazioni query. Per Località dei dati, seleziona USA (più regioni negli Stati Uniti).
Fai clic su Esegui.
Una volta completata la query, fai clic sulla scheda Risultati sotto l'area di testo della query. I risultati dovrebbero essere simili ai seguenti:

Pagina Risultati delle query che mostra 6 righe di dati sotto le intestazioni delle colonne: Riga, caratteristica e attribuzione

Attività 8: esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.

Eliminazione del set di dati

L'eliminazione del progetto rimuove tutti i set di dati e tutte le tabelle nel progetto. Se preferisci riutilizzare il progetto, puoi eliminare il set di dati creato in questo tutorial:

Se necessario, apri la pagina BigQuery nella console Cloud.
Nel riquadro Explorer, fai clic su Visualizza azioni () accanto al tuo set di dati.
Fai clic su Elimina.
Nella finestra di dialogo Elimina set di dati, per confermare il comando, digita delete e fai clic su Elimina.

Eliminazione del progetto

Per eliminare il progetto:

Nella console Cloud, nel menu di navigazione, fai clic su IAM e amministrazione > Gestisci risorse.

Nota: se richiesto, fai clic su ESCI per il lavoro non salvato.

Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
Nella finestra di dialogo, digita l'ID progetto, quindi fai clic su Chiudi per eliminare il progetto.

Complimenti!

Hai imparato a:

Creare un modello di regressione lineare utilizzando l'istruzione CREATE MODEL con BigQuery ML.
Valutare il modello ML con la funzione ML.EVALUATE.
Effettuare previsioni utilizzando il modello ML con la funzione ML.PREDICT.

Passaggi successivi

Per saperne di più sul machine learning, consulta Machine Learning Crash Course.
Per una panoramica di BigQuery ML, consulta Introduzione a BigQuery ML.
Per scoprire di più su come usare la console Cloud, consulta Utilizzo della console Cloud.

Terminare il lab

Una volta completato il lab, fai clic su Termina lab. Qwiklabs rimuove le risorse che hai utilizzato ed esegue la pulizia dell'account.

Avrai la possibilità di inserire una valutazione in merito alla tua esperienza. Seleziona il numero di stelle applicabile, inserisci un commento, quindi fai clic su Invia.

Il numero di stelle corrisponde alle seguenti valutazioni:

1 stella = molto insoddisfatto
2 stelle = insoddisfatto
3 stelle = esperienza neutra
4 stelle = soddisfatto
5 stelle = molto soddisfatto

Se non vuoi lasciare un feedback, chiudi la finestra di dialogo.

Per feedback, suggerimenti o correzioni, utilizza la scheda Assistenza.

Copyright 2026 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.

Utilizzo di BigQuery ML per prevedere il peso dei pinguini

Panoramica

Obiettivi di apprendimento

Configurazione

Abilita l'API BigQuery

Attività 1: crea il tuo set di dati

Attività 2: crea il tuo modello

Dettagli query

Esegui la query CREATE MODEL

Attività 3: ottieni le statistiche di addestramento (attività facoltativa)

Attività 4: valuta il modello

Dettagli query

Esegui la query ML.EVALUATE

Attività 5: usa il tuo modello per prevedere i risultati

Dettagli query

Esegui la query ML.PREDICT

Attività 6: spiega i risultati della previsione con metodi IA spiegabili

Dettagli query

Esegui la query ML.EXPLAIN_PREDICT

Attività 7: spiega il tuo modello a livello globale (attività facoltativa)

Accedi alle spiegazioni globali mediante ML.GLOBAL_EXPLAIN

Dettagli query

Esegui la query ML.GLOBAL_EXPLAIN

Attività 8: esegui la pulizia

Eliminazione del set di dati

Eliminazione del progetto

Complimenti!

Passaggi successivi

Terminare il lab

Prima di iniziare

Utilizza la navigazione privata

Accedi alla console

Utilizza la navigazione privata per eseguire il lab