BigQuery Machine Learning (BigQuery ML) consente agli utenti di creare ed eseguire modelli di machine learning in BigQuery utilizzando query SQL. L'obiettivo è democratizzare il machine learning consentendo a chi utilizza SQL di creare modelli con i propri strumenti esistenti e aumentare la velocità di sviluppo attraverso l'eliminazione della necessità di spostare i dati.
In BigQuery è stato caricato un nuovo set di dati e-commerce con milioni di record Google Analytics per Google Merchandise Store. In questo lab utilizzerai questi dati per creare un modello che prevede se un visitatore effettuerà una transazione.
Cosa imparerai a fare
Come creare, valutare e utilizzare modelli di machine learning in BigQuery
Per ciascun lab, riceverai un nuovo progetto Google Cloud e un insieme di risorse per un periodo di tempo limitato senza alcun costo aggiuntivo.
Accedi a Qwiklabs utilizzando una finestra di navigazione in incognito.
Tieni presente la durata dell'accesso al lab (ad esempio, 1:15:00) e assicurati di finire entro quell'intervallo di tempo.
Non è disponibile una funzionalità di pausa. Se necessario, puoi riavviare il lab ma dovrai ricominciare dall'inizio.
Quando è tutto pronto, fai clic su Inizia lab.
Annota le tue credenziali del lab (Nome utente e Password). Le userai per accedere a Google Cloud Console.
Fai clic su Apri console Google.
Fai clic su Utilizza un altro account e copia/incolla le credenziali per questo lab nei prompt.
Se utilizzi altre credenziali, compariranno errori oppure ti verranno addebitati dei costi.
Accetta i termini e salta la pagina di ripristino delle risorse.
Apri la console di BigQuery
Nella console Google Cloud, seleziona Menu di navigazione > BigQuery.
Si aprirà la finestra con il messaggio Ti diamo il benvenuto in BigQuery nella console Cloud. Questa finestra fornisce un link alla guida rapida ed elenca gli aggiornamenti dell'interfaccia utente.
Fai clic su Fine.
Attività 1: crea un set di dati
Crea un nuovo set di dati all'interno del progetto facendo clic sui tre puntini accanto all'ID progetto nella sezione Explorer e poi su Crea set di dati.
Si apre la finestra di dialogo Crea set di dati.
Inserisci bqml_lab per ID set di dati e fai clic su CREA SET DI DATI (accettando gli altri valori predefiniti).
Attività 2: esplora i dati
I dati che utilizzeremo in questo lab si trovano nel progetto bigquery-public-data, che è disponibile a tutti. Diamo un'occhiata a un campione di questi dati.
Aggiungi la query nella casella Query senza titolo e fai clic sul pulsante Esegui.
#standardSQL
SELECT
IF(totals.transactions IS NULL, 0, 1) AS label,
IFNULL(device.operatingSystem, "") AS os,
device.isMobile AS is_mobile,
IFNULL(geoNetwork.country, "") AS country,
IFNULL(totals.pageviews, 0) AS pageviews
FROM
`bigquery-public-data.google_analytics_sample.ga_sessions_*`
WHERE
_TABLE_SUFFIX BETWEEN '20160801' AND '20170631'
LIMIT 10000;
Le tabelle di dati hanno molte colonne, ma sono poche quelle di nostro interesse che utilizzeremo per creare il nostro modello di ML. Qui verrà usato il sistema operativo del dispositivo del visitatore, se è un dispositivo mobile, il paese o la regione del visitatore e il numero di visualizzazioni della pagina verranno utilizzati come criteri per stabilire se è stata effettuata una transazione. In questo caso, stai cercando di applicare (o prevedere) label.
Questi dati costituiranno i dati di addestramento per il modello di ML creato. I dati di addestramento sono limitati a quelli raccolti dal 1° agosto 2016 al 30 giugno 2017. Ciò consente di salvare i dati dell'ultimo mese per la "previsione". Esiste inoltre un ulteriore limite pari a 10.000 punti dati per risparmiare tempo.
Salviamoli come dati di addestramento. Fai clic su Salva, quindi seleziona Salva vista dal menu a discesa per salvare questa query come vista. Nella finestra popup, seleziona Set di dati come bqml_lab e digita training_data come Nome tabella, quindi fai clic su Salva.
Attività 3: crea un modello
Ora sostituisci la query con quella seguente per creare un modello che preveda se un visitatore effettuerà una transazione:
#standardSQL
CREATE OR REPLACE MODEL `bqml_lab.sample_model`
OPTIONS(model_type='logistic_reg') AS
SELECT * from `bqml_lab.training_data`;
In questo caso, bqml_lab è il nome del set di dati, sample_model è il nome del modello, training_data sono i dati delle transazioni che abbiamo esaminato nell'attività precedente. Il tipo di modello specificato è la regressione logistica binaria.
L'esecuzione del comando CREATE MODEL crea un processo di query che verrà eseguito in modo asincrono in modo da poter, ad esempio, chiudere o aggiornare la finestra della UI di BigQuery.
[Facoltativo] Informazioni sul modello e statistiche di addestramento
Se ti interessa, puoi ottenere informazioni sul modello cliccando sul set di dati bqml_lab nel menu di sinistra e quindi sul modello sample_model nella UI. In Dettagli, dovresti trovare alcune informazioni di base sul modello e opzioni di addestramento utilizzate per produrre il modello. In Addestramento, dovresti vedere una tabella simile a questa:
Attività 4: valuta il modello
Ora sostituisci la query con quella seguente:
#standardSQL
SELECT
*
FROM
ml.EVALUATE(MODEL `bqml_lab.sample_model`);
In questa query, che condivide alcune metriche sul funzionamento del modello, utilizzi la funzione ml.EVALUATE per valutare i valori previsti rispetto ai dati effettivi. Dovresti vedere una tabella simile alla seguente:
Attività 5: usa il modello
Ora fai clic su Query SQL ed esegui questa query:
#standardSQL
SELECT
IF(totals.transactions IS NULL, 0, 1) AS label,
IFNULL(device.operatingSystem, "") AS os,
device.isMobile AS is_mobile,
IFNULL(geoNetwork.country, "") AS country,
IFNULL(totals.pageviews, 0) AS pageviews,
fullVisitorId
FROM
`bigquery-public-data.google_analytics_sample.ga_sessions_*`
WHERE
_TABLE_SUFFIX BETWEEN '20170701' AND '20170801';
Ti renderai conto che le parti di codice SELECT e FROM della query sono simili a quelle utilizzate per generare dati di addestramento. È presente la colonna aggiuntiva fullVisitorId che utilizzerai per prevedere le transazioni per singolo utente. La parte di codice WHERE riflette il cambiamento nell'intervallo di tempo (dal 1° luglio al 1° agosto 2017).
Salviamo questi dati di luglio in modo da poterli utilizzare nei prossimi due passaggi per fare previsioni mediante il nostro modello. Fai clic su Salva, quindi seleziona Salva vista dal menu a discesa per salvare questa query come vista. Nella finestra popup, seleziona Set di dati come bqml_lab e digita july_data come Nome tabella, quindi fai clic su Salva.
Prevedi gli acquisti per paese/regione
Con questa query proverai a prevedere il numero di transazioni effettuate dai visitatori di ciascun paese o regione, ordinerai i risultati e selezionerai i primi 10 per acquisti:
#standardSQL
SELECT
country,
SUM(predicted_label) as total_predicted_purchases
FROM
ml.PREDICT(MODEL `bqml_lab.sample_model`, (
SELECT * FROM `bqml_lab.july_data`))
GROUP BY country
ORDER BY total_predicted_purchases DESC
LIMIT 10;
In questa query utilizzerai ml.PREDICT, mentre la parte BigQuery ML della query è racchiusa con comandi SQL standard. Per questo lab ti interessano il paese e la somma degli acquisti per ciascun paese, ecco perché la query include SELECT, GROUP BY e ORDER BY. LIMIT viene utilizzato per assicurarti di ottenere solo i primi 10 risultati.
Dovresti vedere una tabella simile alla seguente:
Prevedi gli acquisti per utente
Ecco un altro esempio. Questa volta proverai a prevedere il numero di transazioni effettuate da ciascun visitatore, ordinerai i risultati e selezionerai i primi 10 visitatori in base alle transazioni:
#standardSQL
SELECT
fullVisitorId,
SUM(predicted_label) as total_predicted_purchases
FROM
ml.PREDICT(MODEL `bqml_lab.sample_model`, (
SELECT * FROM `bqml_lab.july_data`))
GROUP BY fullVisitorId
ORDER BY total_predicted_purchases DESC
LIMIT 10;
Dovresti vedere una tabella simile alla seguente:
Termina il lab
Una volta completato il lab, fai clic su Termina lab. Google Cloud Skills Boost rimuove le risorse che hai utilizzato ed esegue la pulizia dell'account.
Avrai la possibilità di inserire una valutazione in merito alla tua esperienza. Seleziona il numero di stelle applicabile, inserisci un commento, quindi fai clic su Invia.
Il numero di stelle corrisponde alle seguenti valutazioni:
1 stella = molto insoddisfatto
2 stelle = insoddisfatto
3 stelle = esperienza neutra
4 stelle = soddisfatto
5 stelle = molto soddisfatto
Se non vuoi lasciare un feedback, chiudi la finestra di dialogo.
Per feedback, suggerimenti o correzioni, utilizza la scheda Assistenza.
Copyright 2020 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.
I lab creano un progetto e risorse Google Cloud per un periodo di tempo prestabilito
I lab hanno un limite di tempo e non possono essere messi in pausa. Se termini il lab, dovrai ricominciare dall'inizio.
In alto a sinistra dello schermo, fai clic su Inizia il lab per iniziare
Utilizza la navigazione privata
Copia il nome utente e la password forniti per il lab
Fai clic su Apri console in modalità privata
Accedi alla console
Accedi utilizzando le tue credenziali del lab. L'utilizzo di altre credenziali potrebbe causare errori oppure l'addebito di costi.
Accetta i termini e salta la pagina di ripristino delle risorse
Non fare clic su Termina lab a meno che tu non abbia terminato il lab o non voglia riavviarlo, perché il tuo lavoro verrà eliminato e il progetto verrà rimosso
Questi contenuti non sono al momento disponibili
Ti invieremo una notifica via email quando sarà disponibile
Bene.
Ti contatteremo via email non appena sarà disponibile
Un lab alla volta
Conferma per terminare tutti i lab esistenti e iniziare questo
Utilizza la navigazione privata per eseguire il lab
Utilizza una finestra del browser in incognito o privata per eseguire questo lab. In questo modo eviterai eventuali conflitti tra il tuo account personale e l'account Studente, che potrebbero causare addebiti aggiuntivi sul tuo account personale.
In questo lab imparerai a creare e valutare un modello di machine learning con BigQuery ML e a utilizzare il modello per prevedere il comportamento di acquisto.
Durata:
Configurazione in 0 m
·
Accesso da 90 m
·
Completamento in 60 m