arrow_back

Prevedi gli acquisti dei visitatori con BigQuery ML

Accedi Partecipa
Accedi a oltre 700 lab e corsi

Prevedi gli acquisti dei visitatori con BigQuery ML

Lab 1 ora 30 minuti universal_currency_alt 5 crediti show_chart Introduttivi
info Questo lab potrebbe incorporare strumenti di AI a supporto del tuo apprendimento.
Accedi a oltre 700 lab e corsi

Panoramica

BigQuery Machine Learning (BigQuery ML) consente agli utenti di creare ed eseguire modelli di machine learning in BigQuery utilizzando query SQL. L'obiettivo è democratizzare il machine learning consentendo a chi utilizza SQL di creare modelli con i propri strumenti esistenti e aumentare la velocità di sviluppo attraverso l'eliminazione della necessità di spostare i dati.

In BigQuery è stato caricato un nuovo set di dati e-commerce con milioni di record Google Analytics per Google Merchandise Store. In questo lab utilizzerai questi dati per creare un modello che prevede se un visitatore effettuerà una transazione.

Cosa imparerai a fare

Come creare, valutare e utilizzare modelli di machine learning in BigQuery

Che cosa ti serve

  • Un browser, ad esempio Chrome o Firefox
  • Conoscenza di base di SQL o BigQuery

Configurazione e requisiti

Per ciascun lab, riceverai un nuovo progetto Google Cloud e un insieme di risorse per un periodo di tempo limitato senza alcun costo aggiuntivo.

  1. Accedi a Qwiklabs utilizzando una finestra di navigazione in incognito.

  2. Tieni presente la durata dell'accesso al lab (ad esempio, 1:15:00) e assicurati di finire entro quell'intervallo di tempo.
    Non è disponibile una funzionalità di pausa. Se necessario, puoi riavviare il lab ma dovrai ricominciare dall'inizio.

  3. Quando è tutto pronto, fai clic su Inizia lab.

  4. Annota le tue credenziali del lab (Nome utente e Password). Le userai per accedere a Google Cloud Console.

  5. Fai clic su Apri console Google.

  6. Fai clic su Utilizza un altro account e copia/incolla le credenziali per questo lab nei prompt.
    Se utilizzi altre credenziali, compariranno errori oppure ti verranno addebitati dei costi.

  7. Accetta i termini e salta la pagina di ripristino delle risorse.

Apri la console di BigQuery

  1. Nella console Google Cloud, seleziona Menu di navigazione > BigQuery.

Si aprirà la finestra con il messaggio Ti diamo il benvenuto in BigQuery nella console Cloud. Questa finestra fornisce un link alla guida rapida ed elenca gli aggiornamenti dell'interfaccia utente.

  1. Fai clic su Fine.

Attività 1: crea un set di dati

  1. Crea un nuovo set di dati all'interno del progetto facendo clic sui tre puntini accanto all'ID progetto nella sezione Explorer e poi su Crea set di dati.

Si apre la finestra di dialogo Crea set di dati.

  1. Inserisci bqml_lab per ID set di dati e fai clic su CREA SET DI DATI (accettando gli altri valori predefiniti).

Attività 2: esplora i dati

I dati che utilizzeremo in questo lab si trovano nel progetto bigquery-public-data, che è disponibile a tutti. Diamo un'occhiata a un campione di questi dati.

  1. Aggiungi la query nella casella Query senza titolo e fai clic sul pulsante Esegui.
#standardSQL SELECT IF(totals.transactions IS NULL, 0, 1) AS label, IFNULL(device.operatingSystem, "") AS os, device.isMobile AS is_mobile, IFNULL(geoNetwork.country, "") AS country, IFNULL(totals.pageviews, 0) AS pageviews FROM `bigquery-public-data.google_analytics_sample.ga_sessions_*` WHERE _TABLE_SUFFIX BETWEEN '20160801' AND '20170631' LIMIT 10000;

Le tabelle di dati hanno molte colonne, ma sono poche quelle di nostro interesse che utilizzeremo per creare il nostro modello di ML. Qui verrà usato il sistema operativo del dispositivo del visitatore, se è un dispositivo mobile, il paese o la regione del visitatore e il numero di visualizzazioni della pagina verranno utilizzati come criteri per stabilire se è stata effettuata una transazione. In questo caso, stai cercando di applicare (o prevedere) label.

Questi dati costituiranno i dati di addestramento per il modello di ML creato. I dati di addestramento sono limitati a quelli raccolti dal 1° agosto 2016 al 30 giugno 2017. Ciò consente di salvare i dati dell'ultimo mese per la "previsione". Esiste inoltre un ulteriore limite pari a 10.000 punti dati per risparmiare tempo.

  1. Salviamoli come dati di addestramento. Fai clic su Salva, quindi seleziona Salva vista dal menu a discesa per salvare questa query come vista. Nella finestra popup, seleziona Set di dati come bqml_lab e digita training_data come Nome tabella, quindi fai clic su Salva.

Attività 3: crea un modello

  • Ora sostituisci la query con quella seguente per creare un modello che preveda se un visitatore effettuerà una transazione:
#standardSQL CREATE OR REPLACE MODEL `bqml_lab.sample_model` OPTIONS(model_type='logistic_reg') AS SELECT * from `bqml_lab.training_data`;

In questo caso, bqml_lab è il nome del set di dati, sample_model è il nome del modello, training_data sono i dati delle transazioni che abbiamo esaminato nell'attività precedente. Il tipo di modello specificato è la regressione logistica binaria.

L'esecuzione del comando CREATE MODEL crea un processo di query che verrà eseguito in modo asincrono in modo da poter, ad esempio, chiudere o aggiornare la finestra della UI di BigQuery.

[Facoltativo] Informazioni sul modello e statistiche di addestramento

Se ti interessa, puoi ottenere informazioni sul modello cliccando sul set di dati bqml_lab nel menu di sinistra e quindi sul modello sample_model nella UI. In Dettagli, dovresti trovare alcune informazioni di base sul modello e opzioni di addestramento utilizzate per produrre il modello. In Addestramento, dovresti vedere una tabella simile a questa:

Tabella a sei colonne con 11 righe di dati relativi a iterazione, perdita di dati, tasso di apprendimento, tempo di completamento

Attività 4: valuta il modello

  • Ora sostituisci la query con quella seguente:
#standardSQL SELECT * FROM ml.EVALUATE(MODEL `bqml_lab.sample_model`);

In questa query, che condivide alcune metriche sul funzionamento del modello, utilizzi la funzione ml.EVALUATE per valutare i valori previsti rispetto ai dati effettivi. Dovresti vedere una tabella simile alla seguente:

Tabella dei risultati

Attività 5: usa il modello

  1. Ora fai clic su Query SQL ed esegui questa query:
#standardSQL SELECT IF(totals.transactions IS NULL, 0, 1) AS label, IFNULL(device.operatingSystem, "") AS os, device.isMobile AS is_mobile, IFNULL(geoNetwork.country, "") AS country, IFNULL(totals.pageviews, 0) AS pageviews, fullVisitorId FROM `bigquery-public-data.google_analytics_sample.ga_sessions_*` WHERE _TABLE_SUFFIX BETWEEN '20170701' AND '20170801';

Ti renderai conto che le parti di codice SELECT e FROM della query sono simili a quelle utilizzate per generare dati di addestramento. È presente la colonna aggiuntiva fullVisitorId che utilizzerai per prevedere le transazioni per singolo utente. La parte di codice WHERE riflette il cambiamento nell'intervallo di tempo (dal 1° luglio al 1° agosto 2017).

  1. Salviamo questi dati di luglio in modo da poterli utilizzare nei prossimi due passaggi per fare previsioni mediante il nostro modello. Fai clic su Salva, quindi seleziona Salva vista dal menu a discesa per salvare questa query come vista. Nella finestra popup, seleziona Set di dati come bqml_lab e digita july_data come Nome tabella, quindi fai clic su Salva.

  2. Prevedi gli acquisti per paese/regione

Con questa query proverai a prevedere il numero di transazioni effettuate dai visitatori di ciascun paese o regione, ordinerai i risultati e selezionerai i primi 10 per acquisti:

#standardSQL SELECT country, SUM(predicted_label) as total_predicted_purchases FROM ml.PREDICT(MODEL `bqml_lab.sample_model`, ( SELECT * FROM `bqml_lab.july_data`)) GROUP BY country ORDER BY total_predicted_purchases DESC LIMIT 10;

In questa query utilizzerai ml.PREDICT, mentre la parte BigQuery ML della query è racchiusa con comandi SQL standard. Per questo lab ti interessano il paese e la somma degli acquisti per ciascun paese, ecco perché la query include SELECT, GROUP BY e ORDER BY. LIMIT viene utilizzato per assicurarti di ottenere solo i primi 10 risultati.

Dovresti vedere una tabella simile alla seguente:

Tabella a tre colonne con 10 righe di dati relativi agli acquisti totali previsti per paese

  1. Prevedi gli acquisti per utente

Ecco un altro esempio. Questa volta proverai a prevedere il numero di transazioni effettuate da ciascun visitatore, ordinerai i risultati e selezionerai i primi 10 visitatori in base alle transazioni:

#standardSQL SELECT fullVisitorId, SUM(predicted_label) as total_predicted_purchases FROM ml.PREDICT(MODEL `bqml_lab.sample_model`, ( SELECT * FROM `bqml_lab.july_data`)) GROUP BY fullVisitorId ORDER BY total_predicted_purchases DESC LIMIT 10;

Dovresti vedere una tabella simile alla seguente:

Tabella a tre colonne con 10 righe di dati relativi agli acquisti totali previsti per ID visitatore completo

Termina il lab

Una volta completato il lab, fai clic su Termina lab. Google Cloud Skills Boost rimuove le risorse che hai utilizzato ed esegue la pulizia dell'account.

Avrai la possibilità di inserire una valutazione in merito alla tua esperienza. Seleziona il numero di stelle applicabile, inserisci un commento, quindi fai clic su Invia.

Il numero di stelle corrisponde alle seguenti valutazioni:

  • 1 stella = molto insoddisfatto
  • 2 stelle = insoddisfatto
  • 3 stelle = esperienza neutra
  • 4 stelle = soddisfatto
  • 5 stelle = molto soddisfatto

Se non vuoi lasciare un feedback, chiudi la finestra di dialogo.

Per feedback, suggerimenti o correzioni, utilizza la scheda Assistenza.

Copyright 2020 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.

Prima di iniziare

  1. I lab creano un progetto e risorse Google Cloud per un periodo di tempo prestabilito
  2. I lab hanno un limite di tempo e non possono essere messi in pausa. Se termini il lab, dovrai ricominciare dall'inizio.
  3. In alto a sinistra dello schermo, fai clic su Inizia il lab per iniziare

Utilizza la navigazione privata

  1. Copia il nome utente e la password forniti per il lab
  2. Fai clic su Apri console in modalità privata

Accedi alla console

  1. Accedi utilizzando le tue credenziali del lab. L'utilizzo di altre credenziali potrebbe causare errori oppure l'addebito di costi.
  2. Accetta i termini e salta la pagina di ripristino delle risorse
  3. Non fare clic su Termina lab a meno che tu non abbia terminato il lab o non voglia riavviarlo, perché il tuo lavoro verrà eliminato e il progetto verrà rimosso

Questi contenuti non sono al momento disponibili

Ti invieremo una notifica via email quando sarà disponibile

Bene.

Ti contatteremo via email non appena sarà disponibile

Un lab alla volta

Conferma per terminare tutti i lab esistenti e iniziare questo

Utilizza la navigazione privata per eseguire il lab

Utilizza una finestra del browser in incognito o privata per eseguire questo lab. In questo modo eviterai eventuali conflitti tra il tuo account personale e l'account Studente, che potrebbero causare addebiti aggiuntivi sul tuo account personale.