ラボの設定手順と要件

アカウントと進行状況を保護します。このラボを実行するには、常にシークレットブラウジングウィンドウとラボの認証情報を使用してください。

Gemini を使用したマルチモーダルユースケース

ラボ 1時間 15分 universal_currency_alt クレジット: 1 show_chart 入門

info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。

GSP1278
概要
目標
設定と要件
タスク 1. Vertex AI Workbench でノートブックを開く
タスク 2. ノートブックを設定する
タスク 3. 個々のモダリティ
タスク 4. 複数のモダリティを組み合わせる
タスク 5. ユースケース: 小売 / e コマース
タスク 6. ユースケース: 技術図内のエンティティリレーションシップ
タスク 7. ユースケース: 画像間の比較による類似、異常、相違の抽出
お疲れさまでした

このコンテンツはまだモバイルデバイス向けに最適化されていません。

快適にご利用いただくには、メールで送信されたリンクを使用して、デスクトップパソコンでアクセスしてください。

GSP1278

Google Cloud セルフペースラボのロゴ

概要

このラボでは、Google の高度なマルチモーダル AI モデルである Gemini について包括的に説明します。Google Gen AI SDK for Python を使用して、Gemini API を介してこれらのモデルを操作する方法を学び、学習範囲は、テキスト、PDF、画像、動画、コード、音声など、個々のモダリティを幅広く網羅します。次に、複数のモダリティの組み合わせについて詳しく説明し、さまざまなデータ形式を同時に処理して分析する Gemini の能力を紹介します。最後に、小売業や e コマースの実際のユースケースを見て、Gemini を活用してレコメンデーションを生成し、顧客体験を向上させる方法を確認します。

Gemini

Gemini は、Google DeepMind が開発した強力な生成 AI モデルのファミリーであり、テキスト、コード、画像、音声、動画などのさまざまな形式のコンテンツを理解し、生成することができます。

Vertex AI の Gemini API

Vertex AI の Gemini API は、Gemini モデルを操作するための統合インターフェースを提供します。これにより、開発者は強力な AI 機能をアプリケーションに簡単に組み込むことができます。最新バージョンの詳細情報と具体的な機能については、Gemini の公式ドキュメントをご覧ください。

Gemini モデル

Gemini Pro: 複雑な推論向けに設計されており、次のようなことができます。
- 膨大な量の情報の分析と要約。
- 高度なクロスモーダル推論（テキスト、コード、画像など）。
- 複雑なコードベースでの効果的な問題解決。
Gemini Flash: 速度と効率が向上するように最適化されており、以下を提供します。
- 1 秒未満の応答時間と高スループット。
- 高品質かつ低コストでの幅広いタスクの実行。
- 空間理解の向上、新しい出力形式（テキスト、音声、画像）、ネイティブでのツール使用（Google 検索、コード実行、サードパーティ機能）など、強化されたマルチモーダル機能。

前提条件

このラボを開始する前に、以下について理解しておく必要があります。

基本的な Python プログラミング。
一般的な API のコンセプト。
Vertex AI Workbench の Jupyter ノートブックでの Python コードの実行。

目標

このラボでは、Google Gen AI SDK for Python を使用して Gemini モデルを操作し、次のことを行う方法を学びます。

個々のテキスト、PDF、画像、動画、コード、音声のシナリオを確認する
さまざまなモダリティの組み合わせを検討する
e コマースのユースケースを実行する
画像を比較して類似、異常、相違を抽出する
技術図内のエンティティリレーションシップを理解する

設定と要件

[ラボを開始] ボタンをクリックする前に

こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。

このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。

このラボを完了するためには、下記が必要です。

標準的なインターネットブラウザ（Chrome を推奨）

注: このラボの実行には、シークレットモード（推奨）またはシークレットブラウジングウィンドウを使用してください。これにより、個人アカウントと受講者アカウント間の競合を防ぎ、個人アカウントに追加料金が発生しないようにすることができます。

ラボを完了するための時間（開始後は一時停止できません）

注: このラボでは、受講者アカウントのみを使用してください。別の Google Cloud アカウントを使用すると、そのアカウントに料金が発生する可能性があります。

ラボを開始して Google Cloud コンソールにログインする方法

[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるダイアログでお支払い方法を選択してください。左側の [ラボの詳細] ペインには、以下が表示されます。
- [Google Cloud コンソールを開く] ボタン
- 残り時間
- このラボで使用する必要がある一時的な認証情報
- このラボを行うために必要なその他の情報（ある場合）
[Google Cloud コンソールを開く] をクリックします（Chrome ブラウザを使用している場合は、右クリックして [シークレットウィンドウで開く] を選択します）。

ラボでリソースがスピンアップし、別のタブで [ログイン] ページが表示されます。

ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
注: [アカウントの選択] ダイアログが表示されたら、[別のアカウントを使用] をクリックします。
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
{{{user_0.username | "Username"}}}
[ラボの詳細] ペインでもユーザー名を確認できます。
[次へ] をクリックします。
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
{{{user_0.password | "Password"}}}
[ラボの詳細] ペインでもパスワードを確認できます。
[次へ] をクリックします。
重要: ラボで提供された認証情報を使用する必要があります。Google Cloud アカウントの認証情報は使用しないでください。注: このラボでご自身の Google Cloud アカウントを使用すると、追加料金が発生する場合があります。
その後次のように進みます。
- 利用規約に同意してください。
- 一時的なアカウントなので、復元オプションや 2 要素認証プロセスは設定しないでください。
- 無料トライアルには登録しないでください。

その後、このタブで Google Cloud コンソールが開きます。

注: Google Cloud のプロダクトやサービスにアクセスするには、ナビゲーションメニューをクリックするか、[検索] フィールドにサービス名またはプロダクト名を入力します。ナビゲーションメニューアイコンと検索フィールド

タスク 1. Vertex AI Workbench でノートブックを開く

Google Cloud コンソールのナビゲーションメニュー（）で、[Vertex AI] > [ワークベンチ] の順にクリックします。
インスタンスを見つけて、[JupyterLab を開く] ボタンをクリックします。

Workbench インスタンスの JupyterLab インターフェースが新しいブラウザタブで開きます。

注: JupyterLab にノートブックが表示されない場合は、次の追加手順でインスタンスを再設定してください。

1. JupyterLab のブラウザタブを閉じて、Workbench のホームページに戻ります。

2. インスタンス名の横にあるチェックボックスをオンにして、[リセット] をクリックします。

3. [JupyterLab を開く] ボタンが再度有効になったら、1 分待ってから [JupyterLab を開く] をクリックします。

タスク 2. ノートブックを設定する

ファイルを開きます。
[Select Kernel] ダイアログで、使用可能なカーネルのリストから [Python 3] を選択します。
ノートブックの「Getting Started」セクションを実行します。[Project ID] と [Location] は事前構成されています。

注: いずれかのノートブックセルの実行で 429 応答が返される場合は、1 分待ってから再度セルを実行し、次に進んでください。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。パッケージをインストールし、ライブラリをインポートする

タスク 3. 個々のモダリティ

このセクションでは、Gemini でサポートされている複数のモダリティについて説明します。

ノートブックの「Individual Modalities」（個々のモダリティ）セクションを実行します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。テキスト、PDF、画像の個々のモダリティ

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。動画の個々のモダリティ

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。音声の個々のモダリティ

注: ノートブックセルの実行中に、タスクが完了前にキャンセルされたことを示す ClientError 499 応答を受け取った場合は、コードセルを再実行してください。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。コードベースの個々のモダリティ

タスク 4. 複数のモダリティを組み合わせる

このセクションでは、Gemini を使用して複数のモダリティをインターリーブする方法について説明します。

ノートブックの「Combining multiple modalities」（複数のモダリティを組み合わせる）セクションを実行します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。複数のモダリティを同時に組み合わせる

タスク 5. ユースケース: 小売 / e コマース

このセクションでは、Gemini を使用して小売業向けレコメンデーションを行うユースケースについて説明します。

ノートブックの「Use Case: retail / e-commerce」（ユースケース: 小売 / e コマース）セクションを実行します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 e コマースのユースケース

タスク 6. ユースケース: 技術図内のエンティティリレーションシップ

このセクションでは、Gemini を使用して図式を理解し、最適化やコード生成などの実践的な手順を行うユースケースについて説明します。

ノートブックの「Use Case: Entity relationships in technical diagrams」（ユースケース: 技術図内のエンティティリレーションシップ）セクションを実行します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。技術図内のエンティティリレーションシップ

タスク 7. ユースケース: 画像間の比較による類似、異常、相違の抽出

このセクションでは、Gemini を使用して画像を比較し、オブジェクト間の類似点や相違点を識別するユースケースについて説明します。

ノートブックの「Use Case: Similarity/Differences」（ユースケース: 類似点 / 相違点）セクションを実行します。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。画像を比較して類似、異常、相違を抽出する

お疲れさまでした

このラボでは、マルチモーダルユースケースで Gemini モデルを使用する方法を学習しました。Gemini の詳細については、以下に示す Vertex AI ドキュメントサイトをご覧ください。

次のステップと詳細情報

以下のリソースで Gemini に関する理解を深めましょう。

Gemini の概要
Vertex AI の生成 AI に関するドキュメント
生成 AI に関する YouTube チャンネル
Vertex AI クックブック。生成 AI に関するノートブックを集めた、検索可能なギャラリーです。
Google Cloud 生成 AI レポジトリ。他のノートブックやサンプルを確認できます。

Google Cloud トレーニングと認定資格

Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベストプラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。

マニュアルの最終更新日: 2025 年 10 月 14 日

ラボの最終テスト日: 2025 年 10 月 14 日

Gemini を使用したマルチモーダル ユースケース

GSP1278

概要

Gemini

Vertex AI の Gemini API

Gemini モデル

前提条件

目標

設定と要件

[ラボを開始] ボタンをクリックする前に

ラボを開始して Google Cloud コンソールにログインする方法

タスク 1. Vertex AI Workbench でノートブックを開く

タスク 2. ノートブックを設定する

タスク 3. 個々のモダリティ

タスク 4. 複数のモダリティを組み合わせる

タスク 5. ユースケース: 小売 / e コマース

タスク 6. ユースケース: 技術図内のエンティティ リレーションシップ

タスク 7. ユースケース: 画像間の比較による類似、異常、相違の抽出

お疲れさまでした

次のステップと詳細情報

Google Cloud トレーニングと認定資格

始める前に

シークレット ブラウジングを使用する

コンソールにログインする

シークレット ブラウジングを使用してラボを実行する

Gemini を使用したマルチモーダルユースケース

タスク 6. ユースケース: 技術図内のエンティティリレーションシップ

シークレットブラウジングを使用する

シークレットブラウジングを使用してラボを実行する