Petunjuk dan persyaratan penyiapan lab
Lindungi akun dan progres Anda. Selalu gunakan jendela browser pribadi dan kredensial lab untuk menjalankan lab ini.

Memuat data ke BigQuery

Lab 1 jam 30 menit universal_currency_alt 5 Kredit show_chart Pengantar
info Lab ini mungkin menggabungkan alat AI untuk mendukung pembelajaran Anda.
Konten ini belum dioptimalkan untuk perangkat seluler.
Untuk pengalaman terbaik, kunjungi kami dengan komputer desktop menggunakan link yang dikirim melalui email.

Ringkasan

BigQuery adalah database analisis berbiaya rendah dan NoOps yang dikelola sepenuhnya oleh Google. Dengan BigQuery, Anda dapat mengkueri data berskala terabyte tanpa perlu mengelola infrastruktur atau memiliki administrator database. BigQuery menggunakan SQL dan memanfaatkan model bayar sesuai penggunaan. Dengan BigQuery, Anda dapat berfokus pada analisis data untuk menemukan insight yang bermakna.

Di lab ini, Anda akan menyerap subset data perjalanan taksi NYC ke tabel di dalam BigQuery.

Yang akan Anda pelajari

  • Memuat data ke dalam BigQuery dari berbagai sumber
  • Memuat data ke dalam BigQuery menggunakan CLI dan Konsol
  • Menggunakan DDL untuk membuat tabel

Penyiapan

Untuk setiap lab, Anda akan memperoleh project Google Cloud baru serta serangkaian resource selama jangka waktu tertentu, tanpa biaya.

  1. Login ke Qwiklabs menggunakan jendela samaran.

  2. Perhatikan waktu akses lab (misalnya, 1:15:00), dan pastikan Anda dapat menyelesaikannya dalam waktu tersebut.
    Tidak ada fitur jeda. Bila perlu, Anda dapat memulai ulang lab, tetapi Anda harus memulai dari awal.

  3. Jika sudah siap, klik Start lab.

  4. Catat kredensial lab (Nama pengguna dan Sandi) Anda. Anda akan menggunakannya untuk login ke Google Cloud Console.

  5. Klik Open Google Console.

  6. Klik Use another account, lalu salin/tempel kredensial lab ini ke perintah yang muncul.
    Jika menggunakan kredensial lain, Anda akan menerima pesan error atau dikenai biaya.

  7. Setujui ketentuan dan lewati halaman resource pemulihan.

Membuka Konsol BigQuery

  1. Di Konsol Google Cloud, pilih Navigation menu > BigQuery.

Kotak pesan Welcome to BigQuery in the Cloud Console akan terbuka. Kotak pesan ini menyediakan link ke panduan memulai dan membuat daftar update UI.

  1. Klik Selesai.

Tugas 1. Membuat set data baru untuk menyimpan tabel

  1. Untuk membuat set data, klik ikon View actions (titik tiga vertikal) di samping project ID Anda, lalu pilih Create dataset.

  2. Selanjutnya, beri nama ID Set Data nyctaxi lalu biarkan semua opsi lain tetap pada nilai defaultnya, kemudian klik Create dataset.

Anda akan melihat set data nyctaxi pada nama project Anda.

Klik Check my progress untuk memverifikasi tujuan. Membuat set data untuk menyimpan tabel baru

Tugas 2. Menyerap set data baru dari CSV

Pada bagian ini, Anda akan memuat CSV lokal ke dalam Tabel BigQuery.

  1. Download subset data perjalanan taksi NYC 2018 secara lokal ke komputer Anda dari link ini.

  2. Pada Konsol BigQuery, pilih set data nyctaxi, lalu klik Create Table

Tentukan opsi tabel di bawah:

Sumber:

  • Buat tabel dari: Upload
  • Pilih File: pilih file yang Anda download secara lokal sebelumnya
  • Format file: CSV

Tujuan:

  • Nama tabel: 2018trips Biarkan semua setelan lain tetap pada setelan default.

Skema:

  • Periksa Auto Detect (tips: Tidak melihat kotak centang? Pastikan format filenya adalah CSV, bukan Avro)

Opsi Lanjutan

  • Biarkan opsi tetap pada nilai default

Klik Create Table.

  1. Sekarang, Anda akan melihat tabel 2018trips di bawah set data nyctaxi.

Pilih tabel 2018trips dan lihat detail:

  1. Pilih Preview dan pastikan semua kolom telah dimuat (berikut sampelnya):

Anda berhasil memuat file CSV ke dalam Tabel BigQuery baru.

Menjalankan Kueri SQL

Berikutnya, berlatihlah dengan kueri dasar di tabel 2018trips.

  1. Pada Editor Kueri, tulis kueri untuk membuat daftar 5 perjalanan termahal tahun ini:
#standardSQL SELECT * FROM nyctaxi.2018trips ORDER BY fare_amount DESC LIMIT 5

Klik Check my progress untuk memverifikasi tujuan. Menyerap Set Data baru dari CSV

Tugas 3. Menyerap set data baru dari Google Cloud Storage

Sekarang, mari kita coba memuat subset lain dari data perjalanan 2018 yang sama dan tersedia di Cloud Storage. Kali ini, mari kita gunakan alat CLI untuk melakukannya.

  1. Jalankan perintah berikut di Cloud Shell:
bq load \ --source_format=CSV \ --autodetect \ --noreplace \ nyctaxi.2018trips \ gs://cloud-training/OCBL013/nyc_tlc_yellow_trips_2018_subset_2.csv Catatan: Dengan tugas pemuatan di atas, Anda menetapkan bahwa subset ini ditambahkan ke tabel 2018trips yang sudah ada dan dibuat di atas.
  1. Setelah tugas pemuatan selesai, Anda akan menerima konfirmasi di layar.

  2. Kembali di konsol BigQuery Anda, pilih tabel 2018trips dan lihat detail. Pastikan jumlah baris sekarang bertambah hampir dua kali lipat.

  3. Anda mungkin perlu menjalankan kueri yang sama seperti sebelumnya untuk melihat berubah tidaknya 5 perjalanan termahal.

Klik Check my progress untuk memverifikasi tujuan. Menyerap set data dari Google Cloud Storage

Tugas 4. Membuat tabel dari tabel lain dengan DDL

Tabel 2018trips kini memiliki perjalanan dari seluruh bulan pada tahun 2018. Bagaimana jika Anda hanya tertarik pada perjalanan bulan Januari? Untuk tujuan lab ini, kami akan tetap memberikan kemudahan serta hanya berfokus pada tanggal dan waktu pengambilan. Mari kita gunakan DDL untuk mengekstrak dan menyimpan data ini ke dalam tabel lain

  1. Pada Editor Kueri, jalankan perintah CREATE TABLE berikut:
#standardSQL CREATE TABLE nyctaxi.january_trips AS SELECT * FROM nyctaxi.2018trips WHERE EXTRACT(Month FROM pickup_datetime)=1;
  1. Sekarang, jalankan kueri berikut di Editor Kueri, lalu temukan jarak terjauh yang ditempuh pada bulan Januari:
#standardSQL SELECT * FROM nyctaxi.january_trips ORDER BY trip_distance DESC LIMIT 1

Klik Check my progress untuk memverifikasi tujuan. Membuat tabel dari tabel lain dengan DDL

Selamat!

Anda telah berhasil membuat set data baru dan menyerap data ke dalam BigQuery dari CSV, Google Cloud Storage, dan Tabel BigQuery lainnya.

Mengakhiri lab Anda

Setelah Anda menyelesaikan lab, klik Akhiri Lab. Google Cloud Skills Boost menghapus resource yang telah Anda gunakan dan membersihkan akun.

Anda akan diberi kesempatan untuk menilai pengalaman menggunakan lab. Pilih jumlah bintang yang sesuai, ketik komentar, lalu klik Submit.

Makna jumlah bintang:

  • 1 bintang = Sangat tidak puas
  • 2 bintang = Tidak puas
  • 3 bintang = Netral
  • 4 bintang = Puas
  • 5 bintang = Sangat puas

Anda dapat menutup kotak dialog jika tidak ingin memberikan masukan.

Untuk masukan, saran, atau koreksi, gunakan tab Support.

Manual Terakhir Diperbarui: 27 Juli 2022

Lab Terakhir Diuji: 15 Juli 2022

Hak cipta 2026 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.

Sebelum memulai

  1. Lab membuat project dan resource Google Cloud untuk jangka waktu tertentu
  2. Lab memiliki batas waktu dan tidak memiliki fitur jeda. Jika lab diakhiri, Anda harus memulainya lagi dari awal.
  3. Di kiri atas layar, klik Start lab untuk memulai

Gunakan penjelajahan rahasia

  1. Salin Nama Pengguna dan Sandi yang diberikan untuk lab tersebut
  2. Klik Open console dalam mode pribadi

Login ke Konsol

  1. Login menggunakan kredensial lab Anda. Menggunakan kredensial lain mungkin menyebabkan error atau dikenai biaya.
  2. Setujui persyaratan, dan lewati halaman resource pemulihan
  3. Jangan klik End lab kecuali jika Anda sudah menyelesaikan lab atau ingin mengulanginya, karena tindakan ini akan menghapus pekerjaan Anda dan menghapus project

Konten ini tidak tersedia untuk saat ini

Kami akan memberi tahu Anda melalui email saat konten tersedia

Bagus!

Kami akan menghubungi Anda melalui email saat konten tersedia

Satu lab dalam satu waktu

Konfirmasi untuk mengakhiri semua lab yang ada dan memulai lab ini

Gunakan penjelajahan rahasia untuk menjalankan lab

Menggunakan jendela Samaran atau browser pribadi adalah cara terbaik untuk menjalankan lab ini. Langkah ini akan mencegah konflik antara akun pribadi Anda dan akun Siswa, yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.