ラボの設定手順と要件
アカウントと進行状況を保護します。このラボを実行するには、常にシークレット ブラウジング ウィンドウとラボの認証情報を使用してください。

BigQuery へのデータの読み込み

ラボ 1時間 30分 universal_currency_alt クレジット: 5 show_chart 入門
info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。
このコンテンツはまだモバイル デバイス向けに最適化されていません。
快適にご利用いただくには、メールで送信されたリンクを使用して、デスクトップ パソコンでアクセスしてください。

概要

BigQuery は、Google が提供する低コスト、NoOps のフルマネージド分析データベースです。BigQuery では、インフラストラクチャを所有して管理したりデータベース管理者を置いたりすることなく、テラバイト単位の大規模なデータでクエリを実行できます。また、SQL が採用されており、従量課金制というメリットもあります。このような特長を活かし、ユーザーは有用な情報を得るためのデータ分析に専念できます。

このラボでは、ニューヨーク市のタクシー賃走データのサブセットを BigQuery 内のテーブルに取り込む演習を行います。

学習内容

  • さまざまなソースから BigQuery にデータを読み込む
  • コンソールと CLI を使用して BigQuery にデータを読み込む
  • DDL を使用してテーブルを作成する

設定

各ラボでは、新しい Google Cloud プロジェクトとリソースセットを一定時間無料で利用できます。

  1. Qwiklabs にシークレット ウィンドウでログインします。

  2. ラボのアクセス時間(例: 1:15:00)に注意し、時間内に完了できるようにしてください。
    一時停止機能はありません。必要な場合はやり直せますが、最初からになります。

  3. 準備ができたら、[ラボを開始] をクリックします。

  4. ラボの認証情報(ユーザー名パスワード)をメモしておきます。この情報は、Google Cloud Console にログインする際に使用します。

  5. [Google Console を開く] をクリックします。

  6. [別のアカウントを使用] をクリックし、このラボの認証情報をコピーしてプロンプトに貼り付けます。
    他の認証情報を使用すると、エラーが発生したり、料金の請求が発生したりします。

  7. 利用規約に同意し、再設定用のリソースページをスキップします。

BigQuery コンソールを開く

  1. Google Cloud コンソールで、ナビゲーション メニュー > [BigQuery] を選択します。

[Cloud Console の BigQuery へようこそ] メッセージ ボックスが開きます。このメッセージ ボックスにはクイックスタート ガイドへのリンクと、UI の更新情報が表示されます。

  1. [完了] をクリックします。

タスク 1. テーブルを格納するための新しいデータセットを作成する

  1. データセットを作成するには、プロジェクト ID の横にあるアクションを表示アイコン(その他アイコン)をクリックし、[データセットを作成] を選択します。

  2. 次に、[データセット ID] の名前を「nyctaxi」にします。他のオプションはすべてデフォルト値のままにして [データセットを作成] をクリックします。

プロジェクト名の下に nyctaxi データセットが表示されます。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 新しいテーブルを保存するためのデータセットを作成する

タスク 2. CSV から新しいデータセットを取り込む

このセクションでは、ローカルの CSV を BigQuery テーブルに読み込みます。

  1. ニューヨーク市における 2018 年のタクシー賃走データのサブセットを、こちらのリンクからローカルのパソコンにダウンロードします。

  2. BigQuery コンソールで、nyctaxi データセットを選択し、[テーブルを作成] をクリックします。

以下のテーブル オプションを指定します。

ソース:

  • テーブルの作成元: アップロード
  • ファイルを選択: 先ほどローカルにダウンロードしたファイルを選択
  • ファイル形式: CSV

送信先:

  • テーブル名: 2018trips 他の設定はすべてデフォルトのままにします。

スキーマ:

  • [自動検出] をオンにします(ヒント: このチェックボックスが表示されていない場合は、ファイル形式が Avro ではなく CSV であることを確認してください)。

詳細オプション

  • デフォルトのままにします。

[テーブルを作成] をクリックします。

  1. nyctaxi データセットの下に 2018trips テーブルが表示されます。

2018trips テーブルを選択し、[詳細] を表示します。

  1. [プレビュー] を選択して、すべての列が読み込まれていることを確認します(以下はその一部を取り出したものです)。

CSV ファイルを新しい BigQuery テーブルに読み込むことができました。

SQL クエリを実行する

次に、2018trips テーブルに対する基本クエリの実践演習を行います。

  1. 年間で料金の高かった上位 5 件の賃走をリストするクエリをクエリエディタに記述します。
#standardSQL SELECT * FROM nyctaxi.2018trips ORDER BY fare_amount DESC LIMIT 5

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 CSV から新しいデータセットを取り込む

タスク 3. Google Cloud Storage から新しいデータセットを取り込む

次に、Cloud Storage から 2018 年の同じ賃走データの別のサブセットを読み込んでみます。今回は CLI ツールを使用します。

  1. Cloud Shell で、次のコマンドを実行します。
bq load \ --source_format=CSV \ --autodetect \ --noreplace \ nyctaxi.2018trips \ gs://cloud-training/OCBL013/nyc_tlc_yellow_trips_2018_subset_2.csv 注: この読み込みジョブでは、先に作成した既存の 2018trips テーブルに、対象のサブセットを追加するよう指定しています。
  1. 読み込みジョブが完了すると、画面に確認メッセージが表示されます。

  2. BigQuery コンソールに戻り、2018trips テーブルを選択して [詳細] を表示します。行数がほぼ倍になっていることを確認します。

  3. 先ほどと同じクエリを実行して、料金の高かった上位 5 件の賃走に変化があるかどうかを確認します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Google Cloud Storage からデータセットを取り込む

タスク 4. DDL を使用して他のテーブルからテーブルを作成する

ここまでで、2018trips テーブルには年間すべての賃走データが含まれるようになっています。1 月の賃走データだけが必要な場合はどうすればよいでしょうか。このラボでは、話をシンプルにするために乗車日時にだけ注目します。データ定義言語(DDL)を使用して、このデータを取り出して新しいテーブルに格納してみましょう。

  1. クエリエディタで、次の CREATE TABLE コマンドを実行します。
#standardSQL CREATE TABLE nyctaxi.january_trips AS SELECT * FROM nyctaxi.2018trips WHERE EXTRACT(Month FROM pickup_datetime)=1;
  1. ここで、クエリエディタで次のクエリを実行し、1 月の最長賃走距離を特定します。
#standardSQL SELECT * FROM nyctaxi.january_trips ORDER BY trip_distance DESC LIMIT 1

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 DDL を使用して他のテーブルからテーブルを作成する

お疲れさまでした

このラボでは、新しいデータセットを作成し、CSV、Google Cloud Storage、他の BigQuery テーブルから BigQuery にデータを取り込みました。

ラボを終了する

ラボが完了したら、[ラボを終了] をクリックします。ラボで使用したリソースが Google Cloud Skills Boost から削除され、アカウントの情報も消去されます。

ラボの評価を求めるダイアログが表示されたら、星の数を選択してコメントを入力し、[送信] をクリックします。

星の数は、それぞれ次の評価を表します。

  • 星 1 つ = 非常に不満
  • 星 2 つ = 不満
  • 星 3 つ = どちらともいえない
  • 星 4 つ = 満足
  • 星 5 つ = 非常に満足

フィードバックを送信しない場合は、ダイアログ ボックスを閉じてください。

フィードバックやご提案の送信、修正が必要な箇所をご報告いただく際は、[サポート] タブをご利用ください。

マニュアルの最終更新日: 2022 年 7 月 27 日

ラボの最終テスト日: 2022 年 7 月 15 日

Copyright 2026 Google LLC All rights reserved. Google および Google のロゴは、Google LLC の商標です。その他すべての社名および製品名は、それぞれ該当する企業の商標である可能性があります。

始める前に

  1. ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
  2. ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
  3. 画面左上の [ラボを開始] をクリックして開始します

シークレット ブラウジングを使用する

  1. ラボで使用するユーザー名パスワードをコピーします
  2. プライベート モードで [コンソールを開く] をクリックします

コンソールにログインする

    ラボの認証情報を使用して
  1. ログインします。他の認証情報を使用すると、エラーが発生したり、料金が発生したりする可能性があります。
  2. 利用規約に同意し、再設定用のリソースページをスキップします
  3. ラボを終了する場合や最初からやり直す場合を除き、[ラボを終了] はクリックしないでください。クリックすると、作業内容がクリアされ、プロジェクトが削除されます

このコンテンツは現在ご利用いただけません

利用可能になりましたら、メールでお知らせいたします

ありがとうございます。

利用可能になりましたら、メールでご連絡いたします

1 回に 1 つのラボ

既存のラボをすべて終了して、このラボを開始することを確認してください

シークレット ブラウジングを使用してラボを実行する

このラボを実行するには、シークレット モードまたはシークレット ブラウジング ウィンドウを使用することをおすすめします。これにより、個人アカウントと受講者アカウントの競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。