Dieser Inhalt ist noch nicht für Mobilgeräte optimiert.
Die Lernumgebung funktioniert am besten, wenn Sie auf einem Computer über einen per E‑Mail gesendeten Link darauf zugreifen.
Überblick
BigQuery ist eine vollständig verwaltete, kostengünstige NoOps-Analysedatenbank von Google. Mit diesem Tool können Sie mehrere Terabyte an Daten abfragen und müssen dabei weder eine Infrastruktur verwalten noch benötigen Sie einen Datenbankadministrator. BigQuery basiert auf SQL und kann als „Pay as you go“-Modell genutzt werden. Mithilfe von BigQuery können Sie sich auf die Datenanalyse konzentrieren und wichtige Insights gewinnen.
In diesem Lab werden Sie in BigQuery Teilmengen aus Fahrtendaten von New Yorker Taxis in Tabellen aufnehmen.
Lerninhalte
Daten aus verschiedenen Quellen in BigQuery laden
Daten über die Kommandozeile und die Console in BigQuery laden
Tabellen mit DDL erstellen
Einrichtung
Für jedes Lab werden Ihnen ein neues Google Cloud-Projekt und die entsprechenden Ressourcen für eine bestimmte Zeit kostenlos zur Verfügung gestellt.
Melden Sie sich über ein Inkognitofenster in Qwiklabs an.
Beachten Sie die Zugriffszeit (z. B. 1:15:00). Das Lab muss in dieser Zeit abgeschlossen werden.
Es gibt keine Pausenfunktion. Sie können bei Bedarf neu starten, müssen dann aber von vorn beginnen.
Wenn Sie bereit sind, klicken Sie auf Lab starten.
Notieren Sie sich Ihre Anmeldedaten (Nutzername und Passwort). Mit diesen Daten melden Sie sich in der Google Cloud Console an.
Klicken Sie auf Google Console öffnen.
Klicken Sie auf Anderes Konto verwenden. Kopieren Sie den Nutzernamen und das Passwort für dieses Lab und fügen Sie beides in die entsprechenden Felder ein.
Wenn Sie andere Anmeldedaten verwenden, tritt ein Fehler auf oder es fallen Kosten an.
Akzeptieren Sie die Nutzungsbedingungen und überspringen Sie die Seite zur Wiederherstellung der Ressourcen.
BigQuery-Konsole öffnen
Klicken Sie in der Google Cloud Console im Navigationsmenü auf BigQuery.
Zuerst wird das Fenster Willkommen bei BigQuery in der Cloud Console geöffnet, das einen Link zur Kurzanleitung und Informationen zu Aktualisierungen der Benutzeroberfläche enthält.
Klicken Sie auf Fertig.
Aufgabe 1: Neues Dataset zum Speichern von Tabellen erstellen
Zum Erstellen eines Datasets klicken Sie auf das Symbol Aktionen ansehen (drei vertikale Punkte) neben der Projekt-ID und wählen Dataset erstellen aus.
Benennen Sie die Dataset-ID mit nyctaxi und behalten Sie für alle anderen Optionen die Standardwerte bei. Klicken Sie dann auf Dataset erstellen.
Das Dataset „nyctaxi“ wird jetzt unter dem Namen Ihres Projekts angezeigt.
Klicken Sie auf Fortschritt prüfen.
Dataset zum Speichern neuer Tabellen erstellen
Aufgabe 2: Neues Dataset aus einer CSV-Datei aufnehmen
In diesem Abschnitt laden Sie eine lokale CSV-Datei in eine BigQuery-Tabelle.
Über diesen Link können Sie einige Fahrtendaten der New Yorker Taxis aus dem Jahr 2018 herunterladen.
Wählen Sie in der BigQuery Console das Dataset nyctaxi aus und klicken Sie dann auf Tabelle erstellen.
Geben Sie die folgenden Tabellenoptionen an:
Quelle:
Tabelle erstellen aus: Upload
Datei auswählen: Wählen Sie die Datei aus, die Sie zuvor heruntergeladen haben.
Dateiformat: CSV
Ziel:
Tabellenname: 2018trips
Übernehmen Sie bei den anderen Einstellungen die Standardwerte.
Schema:
Markieren Sie das Kästchen Automatisch erkennen. (Tipp: Sie können das Kästchen nicht sehen? Achten Sie darauf, dass das Dateiformat CSV und nicht Avro ist.)
Erweiterte Optionen:
Übernehmen Sie die Standardwerte.
Klicken Sie auf Tabelle erstellen.
Die Tabelle 2018trips sollte jetzt unter dem Dataset „nyctaxi“ zu sehen sein.
Wählen Sie die Tabelle „2018trips“ aus und sehen Sie sich die Details an:
Klicken Sie auf Vorschau und prüfen Sie, ob alle Spalten geladen wurden (Beispiel unten):
Sie haben eine CSV-Datei in eine neue BigQuery-Tabelle geladen.
SQL-Abfragen ausführen
Üben Sie anschließend eine einfache Abfrage bei der Tabelle „2018trips“.
Schreiben Sie im Abfrageeditor eine Abfrage, um die 5 teuersten Fahrten des Jahres aufzulisten:
#standardSQL
SELECT
*
FROM
nyctaxi.2018trips
ORDER BY
fare_amount DESC
LIMIT 5
Klicken Sie auf Fortschritt prüfen.
Neues Dataset aus einer CSV-Datei aufnehmen
Aufgabe 3: Neues Dataset aus Google Cloud Storage aufnehmen
Versuchen Sie jetzt, eine weitere Teilmenge der Fahrtendaten von 2018 über Cloud Storage zu laden. Dieses Mal nutzen Sie das Befehlszeilentool.
Führen Sie in Cloud Shell den folgenden Befehl aus:
bq load \
--source_format=CSV \
--autodetect \
--noreplace \
nyctaxi.2018trips \
gs://cloud-training/OCBL013/nyc_tlc_yellow_trips_2018_subset_2.csv
Hinweis: Mit diesem Ladejob geben Sie an, dass diese Teilmenge an die zuvor erstellte Tabelle „2018trips“ angehängt werden soll.
Nach Abschluss des Ladejobs erhalten Sie eine Benachrichtigung auf dem Bildschirm.
Wechseln Sie wieder zur BigQuery Console, wählen Sie die Tabelle „2018trips“ aus und sehen Sie sich die Details an. Prüfen Sie, ob sich die Zeilenanzahl fast verdoppelt hat.
Vielleicht möchten Sie dieselbe Abfrage wie vorhin durchführen, um festzustellen, ob sich die 5 teuersten Fahrten verändert haben.
Klicken Sie auf Fortschritt prüfen.
Dataset aus Google Cloud Storage aufnehmen
Aufgabe 4: Mit DLL Tabellen aus anderen Tabellen erstellen
Die Tabelle „2018trips“ enthält jetzt Fahrten aus dem gesamten Jahr. Und wenn Sie nur an den Fahrten im Januar interessiert sind? In diesem Lab halten wir es einfach und konzentrieren uns nur auf das Abholdatum und die Abholzeit. Verwenden Sie DDL, um diese Daten zu extrahieren und sie in einer anderen Tabelle zu speichern.
Führen Sie im Abfrageeditor den folgenden CREATE TABLE-Befehl aus:
#standardSQL
CREATE TABLE
nyctaxi.january_trips AS
SELECT
*
FROM
nyctaxi.2018trips
WHERE
EXTRACT(Month
FROM
pickup_datetime)=1;
Führen Sie anschließend die folgende Abfrage im Abfrageeditor aus, um die längste zurückgelegte Strecke im Januar zu ermitteln:
#standardSQL
SELECT
*
FROM
nyctaxi.january_trips
ORDER BY
trip_distance DESC
LIMIT
1
Klicken Sie auf Fortschritt prüfen.
Mit DLL Tabellen aus anderen Tabellen erstellen
Das wars! Sie haben das Lab erfolgreich abgeschlossen.
Sie haben ein neues Dataset erstellt und Daten aus einer CSV-Datei, aus Google Cloud Storage und anderen BigQuery-Tabellen in BigQuery aufgenommen.
Lab beenden
Wenn Sie das Lab abgeschlossen haben, klicken Sie auf Lab beenden. Google Cloud Skills Boost entfernt daraufhin die von Ihnen genutzten Ressourcen und bereinigt das Konto.
Anschließend erhalten Sie die Möglichkeit, das Lab zu bewerten. Wählen Sie die entsprechende Anzahl von Sternen aus, schreiben Sie einen Kommentar und klicken Sie anschließend auf Senden.
Die Anzahl der Sterne hat folgende Bedeutung:
1 Stern = Sehr unzufrieden
2 Sterne = Unzufrieden
3 Sterne = Neutral
4 Sterne = Zufrieden
5 Sterne = Sehr zufrieden
Wenn Sie kein Feedback geben möchten, können Sie das Dialogfeld einfach schließen.
Verwenden Sie für Feedback, Vorschläge oder Korrekturen den Tab Support.
Labs erstellen ein Google Cloud-Projekt und Ressourcen für einen bestimmten Zeitraum
Labs haben ein Zeitlimit und keine Pausenfunktion. Wenn Sie das Lab beenden, müssen Sie von vorne beginnen.
Klicken Sie links oben auf dem Bildschirm auf Lab starten, um zu beginnen
Privates Surfen verwenden
Kopieren Sie den bereitgestellten Nutzernamen und das Passwort für das Lab
Klicken Sie im privaten Modus auf Konsole öffnen
In der Konsole anmelden
Melden Sie sich mit Ihren Lab-Anmeldedaten an. Wenn Sie andere Anmeldedaten verwenden, kann dies zu Fehlern führen oder es fallen Kosten an.
Akzeptieren Sie die Nutzungsbedingungen und überspringen Sie die Seite zur Wiederherstellung der Ressourcen
Klicken Sie erst auf Lab beenden, wenn Sie das Lab abgeschlossen haben oder es neu starten möchten. Andernfalls werden Ihre bisherige Arbeit und das Projekt gelöscht.
Diese Inhalte sind derzeit nicht verfügbar
Bei Verfügbarkeit des Labs benachrichtigen wir Sie per E-Mail
Sehr gut!
Bei Verfügbarkeit kontaktieren wir Sie per E-Mail
Es ist immer nur ein Lab möglich
Bestätigen Sie, dass Sie alle vorhandenen Labs beenden und dieses Lab starten möchten
Privates Surfen für das Lab verwenden
Am besten führen Sie dieses Lab in einem Inkognito- oder privaten Browserfenster aus. So vermeiden Sie Konflikte zwischen Ihrem privaten Konto und dem Teilnehmerkonto, die zusätzliche Kosten für Ihr privates Konto verursachen könnten.
In diesem Lab erfahren Sie, wie Sie in BigQuery Daten in Tabellen aufnehmen.