Bigtable スキーマの設計とクエリ

Create a Bigtable table

進行状況を確認

/ 40

Delete a Bigtable table

進行状況を確認

/ 40

このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。

GSP1053

概要

Bigtable は、Google のフルマネージドでスケーラブルな NoSQL データベースサービスです。大量のデータを Key-Value ストアに格納できるため、パーソナライズ、広告テクノロジー、金融テクノロジー、デジタルメディア、モノのインターネット（IoT）などのユースケースに最適です。また、低レイテンシで高スループットの読み取りと書き込みをサポートしており、大量のデータにすばやくアクセスして処理や分析を行うことができます。

Bigtable では、各行は単一のエンティティ（個々のユーザーやセンサーなど）を表し、一意の行キーでラベル付けされます。各列には、各行の属性値が格納されます。列ファミリーを使用すると、関連する列を整理できます。行と列が交差する部分に複数のセルが存在することがあります。各セルは、特定のタイムスタンプに対するデータの異なるバージョンを表します。

このラボでは、Google Cloud コンソールの Bigtable ページを使用して Bigtable インスタンスの詳細を確認し、Bigtable CLI（cbt CLI）を使用して Bigtable テーブルのデータをクエリします。さらに、Bigtable のベストプラクティスに沿ってテーブルスキーマと行キーを設計します。

演習内容

このラボでは、Bigtable インスタンスにアクセスして Bigtable スキーマをクエリする方法を学びます。

Google Cloud コンソールを使用して Bigtable インスタンスの詳細を見る。
インスタンスの cbt CLI を構成する。
Bigtable のベストプラクティスを使用して、適切なスキーマと行キーを設計する。
Bigtable 内のデータをクエリする。

前提条件

インスタンス、スキーマ、キーなどのデータベースのコンセプトと用語に関する基本的な知識が必要です。

設定と要件

[ラボを開始] ボタンをクリックする前に

こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。

このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

このラボを完了するためには、下記が必要です。

標準的なインターネットブラウザ（Chrome を推奨）

注: このラボの実行には、シークレットモード（推奨）またはシークレットブラウジングウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生しないようにすることができます。

ラボを完了するための時間（開始後は一時停止できません）

注: このラボでは、受講者アカウントのみを使用してください。別の Google Cloud アカウントを使用すると、そのアカウントに料金が発生する可能性があります。

ラボを開始して Google Cloud コンソールにログインする方法

[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるダイアログでお支払い方法を選択してください。左側の [ラボの詳細] ペインには、以下が表示されます。
- [Google Cloud コンソールを開く] ボタン
- 残り時間
- このラボで使用する必要がある一時的な認証情報
- このラボを行うために必要なその他の情報（ある場合）
[Google Cloud コンソールを開く] をクリックします（Chrome ブラウザを使用している場合は、右クリックして [シークレットウィンドウで開く] を選択します）。

ラボでリソースがスピンアップし、別のタブで [ログイン] ページが表示されます。

ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
{{{user_0.username | "Username"}}}
[ラボの詳細] ペインでもユーザー名を確認できます。
[次へ] をクリックします。
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
{{{user_0.password | "Password"}}}
[ラボの詳細] ペインでもパスワードを確認できます。
[次へ] をクリックします。
重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。
その後次のように進みます。
- 利用規約に同意してください。
- 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
- 無料トライアルには登録しないでください。

その後、このタブで Google Cloud コンソールが開きます。

注: Google Cloud のプロダクトやサービスにアクセスするには、ナビゲーションメニューをクリックするか、[検索] フィールドにサービス名またはプロダクト名を入力します。ナビゲーションメニューアイコンと検索フィールド

Cloud Shell をアクティブにする

Cloud Shell は、開発ツールと一緒に読み込まれる仮想マシンです。5 GB の永続ホームディレクトリが用意されており、Google Cloud で稼働します。Cloud Shell を使用すると、コマンドラインで Google Cloud リソースにアクセスできます。

Google Cloud コンソールの上部にある「Cloud Shell をアクティブにする」アイコンをクリックします。
ウィンドウで次の操作を行います。
- Cloud Shell 情報ウィンドウで操作を進めます。
- Cloud Shell が認証情報を使用して Google Cloud API を呼び出すことを承認します。

接続した時点で認証が完了しており、プロジェクトに各自の Project_ID、が設定されます。出力には、このセッションの PROJECT_ID を宣言する次の行が含まれています。

Your Cloud Platform project in this session is set to {{{project_0.project_id | "PROJECT_ID"}}}

gcloud は Google Cloud のコマンドラインツールです。このツールは、Cloud Shell にプリインストールされており、タブ補完がサポートされています。

（省略可）次のコマンドを使用すると、有効なアカウント名を一覧表示できます。

gcloud auth list

[承認] をクリックします。

出力:

ACTIVE: * ACCOUNT: {{{user_0.username | "ACCOUNT"}}} To set the active account, run: $ gcloud config set account `ACCOUNT`

（省略可）次のコマンドを使用すると、プロジェクト ID を一覧表示できます。

gcloud config list project

出力:

[core] project = {{{project_0.project_id | "PROJECT_ID"}}}

注: Google Cloud における gcloud ドキュメントの全文については、gcloud CLI の概要ガイドをご覧ください。

タスク 1. コンソールで Bigtable インスタンスの詳細を見る

このラボ演習では、事前に作成されている Bigtable のインスタンスとテーブルの詳細を見ていきます。このタスクでは、Google Cloud コンソールで personalized-sales という名前の Bigtable インスタンスにアクセスし、インスタンスの詳細を確認します。

Google Cloud コンソールのナビゲーションメニュー（）で、[データベース] の下にある [Bigtable] をクリックします。
Bigtable インスタンスのリストから、[personalized-sales] という名前のインスタンス ID を見つけます。

[ノード] に表示される詳細を確認し、次の質問に答えてください。

インスタンスの詳細に移動するには、[personalized-sales] というインスタンス ID をクリックします。
[インスタンスの編集] をクリックします。

インスタンスの詳細を確認し、次の質問に答えてください。

インスタンスの編集ページを閉じるには、[キャンセル] をクリックします。
クラスタ ID のテーブルで、personalized-sales-cluster1 の行の [編集]（鉛筆アイコン）をクリックします。

クラスタの詳細を確認し、次の質問に答えてください。
クラスタの詳細を閉じるには、[キャンセル] をクリックします。
ナビゲーションメニューの [インスタンス] で、[テーブル] をクリックします。

UserSessions というテーブルの詳細を確認し、次の質問に答えてください。

Bigtable インスタンスの詳細を確認したら、次のタスクに進み、cbt CLI を使用してインスタンスに接続しましょう。

タスク 2. Bigtable CLI を構成する

cbt CLI コマンドを使用して Bigtable に接続するには、まず Cloud Shell を使用して、.cbtrc 構成ファイルのプロジェクト ID と Bigtable インスタンス ID を更新する必要があります。

Cloud Shell へのアクセス方法については、このラボガイドの冒頭にある設定と要件のセクションをご覧ください。

cbt CLI は主にデバッグとデータ探索に使われますが、Bigtable の基礎を学ぶのにも便利なツールです。本番環境で CRUD（作成、読み取り、更新、削除）オペレーションを実施する場合は、Bigtable のいずれかのクライアントライブラリを使用することをおすすめします。

.cbtrc ファイルのプロジェクト ID を変更するには、Cloud Shell で次のコマンドを実行します。

echo project = `gcloud config get-value project` \ >> ~/.cbtrc

プロジェクトで使用可能な Bigtable インスタンスのリストを表示するには、次のコマンドを実行します。

cbt listinstances

出力から、personalized-sales という名前のインスタンスが 1 つ確認できます。

.cbtrc ファイルの Bigtable インスタンス ID を変更するには、次のコマンドを実行します。

echo instance = personalized-sales \ >> ~/.cbtrc

.cbtrc ファイルのプロジェクト ID とインスタンス ID が正常に変更できたことを確認するには、次のコマンドを実行します。

cat ~/.cbtrc

出力は次のようになります。

project = <project-id> instance = personalized-sales

personalized-sales という名前の Bigtable インスタンスで使用可能なテーブルのリストを表示するには、次のコマンドを実行します。

cbt ls

出力から、インスタンスに UserSessions という名前のテーブルが 1 つ含まれていることが確認できます。このテーブルは後のタスクで使用します。

タスク 3. Bigtable でスキーマと行キーを設計する

このタスクでは、Bigtable でスキーマ設計と行キー設計の原則を確認するためのテストテーブルを作成します。

元データを確認してスキーマの設計に役立てる

Bigtable でスキーマと行キーを設計する前に、保存するデータに関する重要なポイントを押さえておきましょう。

ポイント	目的
各行は何を表しているか（個々のユーザーやセンサーなど）	行の構造を把握する
このデータに対して最も頻繁に実行されるクエリは何か	行キーを作成する
各行で収集される値は何か	列を特定する（列修飾子と呼ばれます）
関連する列をグループ化または整理できるか	列ファミリーを特定する

たとえば、e コマース企業のウェブサイトで、全ユーザーのオンラインショッピングセッションを記録するデータセットについて考えてみましょう。各行は、タイムスタンプ付きの各オンラインショッピングセッションを表しています。このデータセットでよく実行されるクエリは、各セッションと関連するユーザー ID の詳細を取得するものです。各ショッピングセッションで保存される値は、セッション中にユーザーが閲覧や購入を行ったすべての商品と、ユーザーの色の好みです。

元データは次のように整理できます。別の商品（blue_jacket や purple_bag など）の列を追加することもできます。

timestamp	user_id	preferred_color	red_skirt	red_hat	orange_shoes	sale
1638940844260	1939	green		seen	seen
1638940844260	2466	blue	seen	seen
1638940844260	1679	blue		seen		blue_blouse#blue_jacket
1638940844260	2737	blue			seen	blue_dress#blue_jacket
1638940844260	582	yellow				yellow_skirt

注: このテーブルで使用されているユーザー ID は、識別子の例示を目的として簡略化したものです。実際の Bigtable のユースケースでは、ユーザーごとにユニバーサルな固有識別子（UUID）を生成してすることが多いでしょう。

テストテーブルを作成する

Bigtable のベストプラクティスは、似たスキーマを持つデータを別々のテーブルではなく同じテーブルに保存することです。たとえば、オンラインショッピングセッションのすべてのデータを 1 つのテーブルに保存することで、簡単にデータを取得できます。

test-sessions という名前の空のテーブルを作成するには、次のコマンドを実行します。

cbt createtable test-sessions

列ファミリーを作成する

Bigtable の列と列ファミリーに関するベストプラクティスには、次のようなものがあります。

列修飾子をデータとして使用して、行ごとの値の重複を避ける。
関連する列は、同じ列ファミリーに整理する。
列ファミリー名は、短くわかりやすい名前にする。

このデータセットでは、商品インタラクションを保存する列修飾子は Interactions という 1 つの列ファミリーにグループ化できます。一方、購入を保存する列修飾子は、Sales という別の列ファミリーに整理できます。これにより、スキーマは次のように整理されます。

...	...	...	Interactions	---	---	Sales
timestamp	user_id	preferred_color	red_skirt	red_hat	orange_shoes	sale
1638940844260	1939	green		seen	seen
1638940844260	2466	blue	seen	seen
1638940844260	1679	blue		seen		blue_blouse#blue_jacket
1638940844260	2737	blue			seen	blue_dress#blue_jacket
1638940844260	582	yellow				yellow_skirt

Interactions という名前の列ファミリーを test_sessions テーブルに追加するには、次のコマンドを実行します。

cbt createfamily test-sessions Interactions

Sales という名前の別の列ファミリーを追加するには、前のコマンドを繰り返して、新しい列ファミリー名を指定します。

cbt createfamily test-sessions Sales

test_sessions テーブルの列ファミリーのリストを表示するには、次のコマンドを実行します。

cbt ls test-sessions

このコマンドは、次の出力を返します。

Family Name GC Policy ----------- --------- Interactions <never> Sales <never>

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Bigtable テーブルを作成します。

行キーを作成する

Bigtable のベストプラクティスは、1 つのエンティティ（個々のオンラインショッピングセッションなど）のすべての情報を 1 行に保存することです。関連するベストプラクティスとしては、定義した範囲の行をクエリして取得しやすい行キーを作成することです。

Bigtable で行キーのベストプラクティスを適用するには、次の点を考慮してください。

データの取得に使用するクエリに基づいて行キーを設計する。
タイムスタンプや連番の数値 ID で始まる行キー、または関連データをグループ化できない行キーは避ける。
一般的な値（国など）から始まり、詳細な値（都市など）で終わる行キーを設計する。
複数の区切られた値を行キーに含める場合は、ユーザー ID に続いてタイムスタンプを付けるなど、言葉で表せる文字列値の形式を使用する。

前のセクションでは、timestamp、user_id、preferred_color は列ファミリーに整理されていませんでした。このデータセットでは、多くのクエリが各セッションとそのユーザー ID の詳細取得を目的としている点は、元データに関する説明のとおりです。

これらのクエリに対応するには、行キーをユーザー ID とセッションのタイムスタンプの組み合わせにするのがよいでしょう。また、特定の色を好むユーザーを検索しやすくするために、行キーに接頭辞として色名を付けてラベル付けする方法も有効です。たとえば、ユーザー ID 1939 の場合は green1939#1638940844260 のようにします。

...	Interactions	---	---	Sales
row_key	red_skirt	red_hat	orange_shoes	sale
green1939#1638940844260		seen	seen
blue2466#1638940844260	seen	seen
blue1679#1638940844260		seen		blue_blouse#blue_jacket
blue2737#1638940844260			seen	blue_dress#blue_jacket
yellow582#1638940844260				yellow_skirt

行キーを使用して Interactions 列ファミリーにデータを追加するには、次のコマンドを実行します。

cbt set test-sessions green1939#1638940844260 Interactions:red_hat=seen

行キーを使用して Sales 列ファミリーにデータを追加するには、次のコマンドを実行します。

cbt set test-sessions blue2737#1638940844260 Sales:sale=blue_dress#blue_jacket

テーブルに保存されているデータを表示するには、次のコマンドを実行します。

cbt read test-sessions

blue2737#1638940844260 のデータは 2 番目に追加されましたが、結果では green1939#1638940844260 より上に表示されます。これは、Bigtable が行キーを辞書順に並べて保存し、レコードも同じ順序で返すためです。アルファベット順に近い並びになりますが、数字で始まる行は 1、13、2、25、6、70 のように、数値としての大小順には並びません。

テストデータをクリーンアップする

テストテーブルを削除するには、次のコマンドを実行します。

cbt deletetable test-sessions

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 Bigtable テーブルを削除します。

タスク 4. Bigtable でデータをクエリする

このタスクでは、cbt CLI を使用して、事前に作成されデータがすべて入力済みのテストテーブルのバージョン（既存の UserSessions テーブル）からデータを取得します。また、Bigtable のスキーマ設計や行キー設計のベストプラクティスが、このテーブルでどのように適用されているかも確認します。

上限を指定してクエリを実行し、行を取得する

このステップでは、UserSessions テーブルに Bigtable のベストプラクティスがどのように適用されているかを調べます。具体的には、このテーブルがオンラインショッピングの各セッションにつき 1 行を持ち、その行にユーザーの商品インタラクションと購入情報がすべて保存されていることを確認します。

テーブルの最初の 5 行のデータを表示するには、次のコマンドを実行します。

cbt read UserSessions \ count=5

出力は次のような構成になります。

---------------------------------------------- ROW KEY COLUMN_FAMILY:COLUMN_QUALIFIER @ TIMESTAMP VALUE COLUMN_FAMILY:COLUMN_QUALIFIER @ TIMESTAMP VALUE ... ---------------------------------------------- ROW KEY COLUMN_FAMILY:COLUMN_QUALIFIER @ TIMESTAMP VALUE COLUMN_FAMILY:COLUMN_QUALIFIER @ TIMESTAMP VALUE ...

出力値は次のようになります。

---------------------------------------------- blue0#1638940844350 Interactions:blue_hat @ 2022/06/08-19:47:33.864000 "viewed details" Interactions:green_jacket @ 2022/06/08-19:47:33.864000 "seen" ... ---------------------------------------------- blue1#1638940844304 Interactions:blue_dress @ 2022/06/08-19:47:33.864000 "purchased" Sales:sale @ 2022/06/08-19:47:33.864000 "blue_dress"

各行には、1 人のユーザーが複数の商品（blue_hat、green_jacket など）に対して行ったインタラクションが記録されており、表示（seen）、詳細を確認（viewed details）、購入（purchased）などのユーザーの行動がわかります。また、購入情報はテーブルの Sales 列ファミリーの sale 列修飾子に記録されます。

UserSessions では、インタラクションタイプ、商品、販売ごとに 1 つのテーブルを作成するのではなく、関連するユーザーインタラクションと商品をすべて 1 つのテーブルに含めるというベストプラクティスが適用されています。さらに、このテーブルでは、各オンラインショッピングセッションにおけるすべての商品のインタラクションと購入が、1 行に保存されています。

行キーでクエリを実行する

Bigtable のクエリでは、次のいずれかの方法でデータを取得するのが最も効率的です。

行キー
行キーの接頭辞
開始行キーと終了行キーで定義された行の範囲

次の手順では、cbt CLI の各オプションを使用して UserSessions テーブルをクエリし、必要なレコードを取得します。

Bigtable クライアントライブラリで行キーを使用してデータの単一行を読み取る方法については、Bigtable のドキュメントをご覧ください。

行キーの接頭辞でクエリを実行する

yellow を好むユーザーの最初の 10 行を表示するには、次のコマンドを実行します。

cbt read UserSessions \ prefix=yellow \ count=10

出力値は次のようになります。

---------------------------------------------- yellow991#1638940844645 Interactions:green_skirt @ 2022/06/08-19:47:33.864000 "seen" Sales:sale @ 2022/06/08-19:47:33.864000 "yellow_skirt"

行キーの特定の範囲でクエリを実行する

特定の行キー範囲内のすべての行を表示するには、次のコマンドを実行します。

cbt read UserSessions \ start=yellow941#1638940844381 \ end=yellow991#1638940844645

出力値は次のようになります。

---------------------------------------------- yellow991#1638940844603 Interactions:blue_blouse @ 2022/06/08-19:47:33.864000 "seen" Sales:sale @ 2022/06/08-19:47:33.864000 "yellow_jacket#yellow_blouse"

read コマンドの範囲は、start 値として指定した行キーから始まり、end 値として指定した行キーの直前で終了します。そのため、行キー yellow991#1638940844645 は出力で返されません。

特定の行キーでクエリを実行する

特定の行キーのすべてのデータを表示するには、次のコマンドを実行します。

cbt lookup UserSessions \ yellow582#1638940844260

出力値は次のようになります。

---------------------------------------------- yellow582#1638940844260 Interactions:blue_jacket @ 2022/06/08-19:47:33.864000 "seen" Sales:sale @ 2022/06/08-19:47:33.864000 "yellow_skirt"

列修飾子と列ファミリーでクエリを実行する

次の手順では、列修飾子や列ファミリーでデータをフィルタして取得し、UserSessions テーブルに列のベストプラクティスがどのように実装されているかを確認します。

Interactions 列ファミリーにデータがある最初の 5 行をクエリするには、次のコマンドを実行します。

cbt read UserSessions count=5 \ columns="Interactions:.*"

出力値は次のようになります。

---------------------------------------------- blue0#1638940844501 Interactions:blue_blouse @ 2022/06/08-19:47:33.864000 "viewed details" Interactions:green_jacket @ 2022/06/08-19:47:33.864000 "seen"

Interactions 列ファミリーの green_jacket 列修飾子にデータがある最初の 5 行をクエリするには、次のコマンドを実行します。

cbt read UserSessions count=5 \ columns="Interactions:green_jacket"

出力値は次のようになります。

---------------------------------------- blue1009#1638940844380 Interactions:green_jacket @ 2022/06/08-21:30:08.683000 "seen" ---------------------------------------- blue101#1638940844263 Interactions:green_jacket @ 2022/06/08-21:30:08.683000 "seen"

Sales 列ファミリーの sale 列修飾子にデータがある最初の 5 行をクエリするには、次のコマンドを実行します。

cbt read UserSessions count=5 \ columns="Sales:sale"

出力値は次のようになります。

---------------------------------------- blue0#1638940844379 Sales:sale @ 2022/06/08-19:47:33.864000 "blue_shoes#blue_shoes" ---------------------------------------------- blue1#1638940844409 Sales:sale @ 2022/06/08-19:47:33.864000 "blue_blouse"

Sales という名前の列ファミリーには列修飾子が 1 つ（sale）しかないため、columns の値 "Sales:sale" と "Sales:.*" はどちらも同じ列を返します。

お疲れさまでした

このラボでは、Google Cloud コンソールを使用して Bigtable インスタンスの詳細を確認し、Cloud Bigtable CLI（cbt CLI）で Bigtable テーブルのデータをクエリしました。さらに、Bigtable のベストプラクティスに沿って、テーブルスキーマと行キーの設計も行いました。

次のステップと詳細情報

Bigtable インスタンスの作成とデータの追加というタイトルのラボをご覧ください。

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベストプラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2024 年 5 月 30 日

ラボの最終テスト日: 2023 年 2 月 16 日

GSP1053

概要

演習内容

前提条件

設定と要件

[ラボを開始] ボタンをクリックする前に

ラボを開始して Google Cloud コンソールにログインする方法

Cloud Shell をアクティブにする

タスク 1. コンソールで Bigtable インスタンスの詳細を見る

タスク 2. Bigtable CLI を構成する

タスク 3. Bigtable でスキーマと行キーを設計する

元データを確認してスキーマの設計に役立てる

テストテーブルを作成する

列ファミリーを作成する

行キーを作成する

テストデータをクリーンアップする

タスク 4. Bigtable でデータをクエリする

上限を指定してクエリを実行し、行を取得する

行キーでクエリを実行する

行キーの接頭辞でクエリを実行する

行キーの特定の範囲でクエリを実行する

特定の行キーでクエリを実行する

列修飾子と列ファミリーでクエリを実行する

お疲れさまでした

次のステップと詳細情報

Google Cloud トレーニングと認定資格

始める前に

シークレット ブラウジングを使用する

コンソールにログインする

シークレット ブラウジングを使用してラボを実行する

シークレットブラウジングを使用する

シークレットブラウジングを使用してラボを実行する