700 以上のラボとコースにアクセス

BigQuery で再現性のあるデータセット分割を作成する v1.5

ラボ 1時間 30分 universal_currency_alt クレジット: 5 show_chart 入門
info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。
700 以上のラボとコースにアクセス

概要

所要時間は 1 分です

ML では再現性が重要です。同じことを今実施した結果と 5 分後に実施した結果が異なると、検証が難しくなります。つまり、なんらかの変更を加えたときに、それが改善につながったかどうかを判断しにくくなります。

必要なもの

  • Qwiklabs で生成されたアカウントで Google Cloud コンソールにログインしている必要があります。

ラボの内容

このラボでは、次の方法について学びます。

  • ML データセットをさまざまな手法で作成した場合の影響を調査する

設定と要件

各ラボでは、新しい Google Cloud プロジェクトとリソースセットを一定時間無料で利用できます。

  1. Qwiklabs にシークレット ウィンドウでログインします。

  2. ラボのアクセス時間(例: 1:15:00)に注意し、時間内に完了できるようにしてください。
    一時停止機能はありません。必要な場合はやり直せますが、最初からになります。

  3. 準備ができたら、[ラボを開始] をクリックします。

  4. ラボの認証情報(ユーザー名パスワード)をメモしておきます。この情報は、Google Cloud Console にログインする際に使用します。

  5. [Google Console を開く] をクリックします。

  6. [別のアカウントを使用] をクリックし、このラボの認証情報をコピーしてプロンプトに貼り付けます。
    他の認証情報を使用すると、エラーが発生したり、料金の請求が発生したりします。

  7. 利用規約に同意し、再設定用のリソースページをスキップします。

タスク 1. Vertex AI Notebooks を起動する

  1. ナビゲーション メニューをクリックします。

  2. [Vertex AI] > [ダッシュボード] の順にクリックします。

  3. [すべての推奨 API を有効化] をクリックします。このアクションは数秒で完了します。

  4. 左側のペインで [ワークベンチ] をクリックします。

  5. [表示] リボンで [ユーザー管理のノートブック] をクリックします。

  6. ページ上部の [+ 新規作成] アイコンをクリックします。

  7. [環境] で、[Python 3 (with Intel® MKL)] を選択します。

  8. サイド ウィンドウの下部にある [詳細オプション] をクリックします。

  9. [リージョン] を 、[ゾーン] を に設定します。

  10. 左側のペインで [マシンタイプ] をクリックします。オプションのリストから [E2-standard] と [e2-standard-4] を選択します。

  11. ページの下部にある [作成] をクリックします。ノートブックの作成まで、通常 4~7 分かかります。

  12. 数分後、Vertex AI のコンソールにインスタンス名と、その後ろに [JUPITERLAB を開く] が表示されます。[JUPITERLAB を開く] をクリックします。

これで、ノートブック環境が設定されました。

タスク 2. AI Platform Notebooks インスタンス内でコース リポジトリのクローンを作成する

training-data-analyst ノートブックのクローンを JupyterLab インスタンス内に作成するには、次の手順を行います。

  1. JupyterLab で、[Terminal] アイコンをクリックして新しいターミナルを開きます。

  2. コマンドライン プロンプトで、次のコマンドを実行します。

    git clone https://github.com/GoogleCloudPlatform/training-data-analyst
  3. リポジトリのクローンが作成されたことを確認するには、training-data-analyst ディレクトリをダブルクリックし、リポジトリのコンテンツが表示されることを確認します。
    このディレクトリには、本コースのすべての Jupyter ノートブック ラボで使用するファイルが含まれています。

タスク 3. 再現可能なデータセット分割を作成する

所要時間は 15 分です

  1. ノートブック インターフェースで、[training-data-analyst] > [courses] > [machine_learning] > [deepdive] > [02_generalization] に移動し、[repeatable_splitting.ipynb] を開きます。

  2. ノートブック インターフェースで、[編集] > [出力をすべて消去] をクリックします。

  3. 説明を読んで、各セルを順番に実行します。

ラボを終了する

ラボが完了したら、[ラボを終了] をクリックします。ラボで使用したリソースが Google Cloud Skills Boost から削除され、アカウントの情報も消去されます。

ラボの評価を求めるダイアログが表示されたら、星の数を選択してコメントを入力し、[送信] をクリックします。

星の数は、それぞれ次の評価を表します。

  • 星 1 つ = 非常に不満
  • 星 2 つ = 不満
  • 星 3 つ = どちらともいえない
  • 星 4 つ = 満足
  • 星 5 つ = 非常に満足

フィードバックを送信しない場合は、ダイアログ ボックスを閉じてください。

フィードバックやご提案の送信、修正が必要な箇所をご報告いただく際は、[サポート] タブをご利用ください。

Copyright 2020 Google LLC All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。

始める前に

  1. ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
  2. ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
  3. 画面左上の [ラボを開始] をクリックして開始します

シークレット ブラウジングを使用する

  1. ラボで使用するユーザー名パスワードをコピーします
  2. プライベート モードで [コンソールを開く] をクリックします

コンソールにログインする

    ラボの認証情報を使用して
  1. ログインします。他の認証情報を使用すると、エラーが発生したり、料金が発生したりする可能性があります。
  2. 利用規約に同意し、再設定用のリソースページをスキップします
  3. ラボを終了する場合や最初からやり直す場合を除き、[ラボを終了] はクリックしないでください。クリックすると、作業内容がクリアされ、プロジェクトが削除されます

このコンテンツは現在ご利用いただけません

利用可能になりましたら、メールでお知らせいたします

ありがとうございます。

利用可能になりましたら、メールでご連絡いたします

1 回に 1 つのラボ

既存のラボをすべて終了して、このラボを開始することを確認してください

シークレット ブラウジングを使用してラボを実行する

このラボの実行には、シークレット モードまたはシークレット ブラウジング ウィンドウを使用してください。これにより、個人アカウントと受講者アカウントの競合を防ぎ、個人アカウントに追加料金が発生することを防ぎます。