始める前に
- ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
- ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
- 画面左上の [ラボを開始] をクリックして開始します
このラボでは、Map オペレーションと Reduce オペレーションの識別、パイプラインの実行、コマンドライン パラメータの使用について学びます。
Map オペレーションと Reduce オペレーションを識別する
パイプラインを実行する
コマンドライン パラメータを使用する
各ラボでは、新しい Google Cloud プロジェクトとリソースセットを一定時間無料で利用できます。
Qwiklabs にシークレット ウィンドウでログインします。
ラボのアクセス時間(例: 1:15:00)に注意し、時間内に完了できるようにしてください。
一時停止機能はありません。必要な場合はやり直せますが、最初からになります。
準備ができたら、[ラボを開始] をクリックします。
ラボの認証情報(ユーザー名とパスワード)をメモしておきます。この情報は、Google Cloud Console にログインする際に使用します。
[Google Console を開く] をクリックします。
[別のアカウントを使用] をクリックし、このラボの認証情報をコピーしてプロンプトに貼り付けます。
他の認証情報を使用すると、エラーが発生したり、料金の請求が発生したりします。
利用規約に同意し、再設定用のリソースページをスキップします。
Google Cloud Shell は、開発ツールと一緒に読み込まれる仮想マシンです。5 GB の永続ホーム ディレクトリが用意されており、Google Cloud で稼働します。
Google Cloud Shell を使用すると、コマンドラインで Google Cloud リソースにアクセスできます。
Google Cloud コンソールで、右上のツールバーにある [Cloud Shell をアクティブにする] ボタンをクリックします。
[続行] をクリックします。
環境がプロビジョニングされ、接続されるまでしばらく待ちます。接続した時点で認証が完了しており、プロジェクトに各自のプロジェクト ID が設定されます。次に例を示します。
gcloud は Google Cloud のコマンドライン ツールです。このツールは、Cloud Shell にプリインストールされており、タブ補完がサポートされています。
出力:
出力例:
出力:
出力例:
Google Cloud Shell コードエディタを使用すると、Cloud Shell インスタンス内でディレクトリやファイルを簡単に作成および編集できます。
これで次の 3 つのインターフェースを利用できるようになりました。
Google Cloud で作業を開始する前に、Identity and Access Management(IAM)内で適切な権限がプロジェクトに付与されていることを確認する必要があります。
Google Cloud コンソールのナビゲーション メニュー()で、[IAM と管理] > [IAM] を選択します。
Compute Engine のデフォルトのサービス アカウント {project-number}-compute@developer.gserviceaccount.com が存在し、編集者のロールが割り当てられていることを確認します。アカウントの接頭辞はプロジェクト番号で、ナビゲーション メニュー > [Cloud の概要] > [ダッシュボード] から確認できます。
編集者のロールがない場合は、以下の手順に沿って必要なロールを割り当てます。729328892908)をコピーします。{project-number} はプロジェクト番号に置き換えてください。このラボを正常に実行するため、特定の手順を完了する必要があります。
Cloud Storage バケットを作成する(ラボ環境の開始時に自動的に完了しています)
Cloud Shell に github リポジトリのクローンを作成する
git clone https://github.com/GoogleCloudPlatform/training-data-analyst
パッケージをアップグレードし、Apache Beam をインストールする
cd training-data-analyst/courses/data_analysis/lab2/python
sudo ./install_packages.sh
/training-data-analyst/courses/data_analysis/lab2/python に移動して、Cloud Shell エディタでファイル is_popular.py を表示します。コードは変更しないでください。
または、nano でファイルを表示することもできます。コードは変更しないでください。
cd ~/training-data-analyst/courses/data_analysis/lab2/python
nano is_popular.py
ファイル is_popular.py に関する次の質問に答えてください。
定義されているカスタム引数は何ですか。
デフォルトの出力プレフィックスは何ですか。
main() で変数 output_prefix はどのように設定されていますか。
--runner などのパイプライン引数はどのように設定されていますか。
このパイプラインで重要なステップは何ですか。
並行して実行されるステップはどれですか。
集計ステップはどれですか。
次のようにパイプラインをローカルで実行します。
cd ~/training-data-analyst/courses/data_analysis/lab2/python
python3 ./is_popular.py
出力ファイルを見つけます。output<サフィックス> という分割ファイルです。
ls -al /tmp
出力ファイルを調べます。「-*」は適切なサフィックスに置き換えてください。
cat /tmp/output-*
出力プレフィックスをデフォルト値から変更します。
python3 ./is_popular.py --output_prefix=/tmp/myoutput
書き出される新しいファイルの名前は何ですか。
/tmp ディレクトリに新しいファイルが作成されたことを確認します。
ls -lrt /tmp/myoutput*
ラボが完了したら、[ラボを終了] をクリックします。ラボで使用したリソースが Google Cloud Skills Boost から削除され、アカウントの情報も消去されます。
ラボの評価を求めるダイアログが表示されたら、星の数を選択してコメントを入力し、[送信] をクリックします。
星の数は、それぞれ次の評価を表します。
フィードバックを送信しない場合は、ダイアログ ボックスを閉じてください。
フィードバックやご提案の送信、修正が必要な箇所をご報告いただく際は、[サポート] タブをご利用ください。
Copyright 2026 Google LLC All rights reserved. Google および Google のロゴは、Google LLC の商標です。その他すべての社名および製品名は、それぞれ該当する企業の商標である可能性があります。
このコンテンツは現在ご利用いただけません
利用可能になりましたら、メールでお知らせいたします
ありがとうございます。
利用可能になりましたら、メールでご連絡いたします
1 回に 1 つのラボ
既存のラボをすべて終了して、このラボを開始することを確認してください