始める前に
- ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
- ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
- 画面左上の [ラボを開始] をクリックして開始します
Install packages and import libraries
/ 20
Individual modalities on text, pdf and image
/ 10
Individual modalities on video
/ 10
Individual modalities on codebase
/ 10
Individual modalities on audio
/ 10
Combining multiple modalities at once
/ 10
E-commerce use case
/ 10
Entity relationships in technical diagrams
/ 10
Compare images for similarities, anomalies, or differences
/ 10
このラボでは、Google の高度なマルチモーダル AI モデルである Gemini について包括的に説明します。Google Gen AI SDK for Python を使用して、Gemini API を介してこれらのモデルを操作する方法を学び、学習範囲は、テキスト、PDF、画像、動画、コード、音声など、個々のモダリティを幅広く網羅します。次に、複数のモダリティの組み合わせについて詳しく説明し、さまざまなデータ形式を同時に処理して分析する Gemini の能力を紹介します。最後に、小売業や e コマースの実際のユースケースを見て、Gemini を活用してレコメンデーションを生成し、顧客体験を向上させる方法を確認します。
Gemini は、Google DeepMind が開発した強力な生成 AI モデルのファミリーであり、テキスト、コード、画像、音声、動画などのさまざまな形式のコンテンツを理解し、生成することができます。
Vertex AI の Gemini API は、Gemini モデルを操作するための統合インターフェースを提供します。これにより、開発者は強力な AI 機能をアプリケーションに簡単に組み込むことができます。最新バージョンの詳細情報と具体的な機能については、Gemini の公式ドキュメントをご覧ください。
このラボを開始する前に、以下について理解しておく必要があります。
このラボでは、Google Gen AI SDK for Python を使用して Gemini モデルを操作し、次のことを行う方法を学びます。
こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。
このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるダイアログでお支払い方法を選択してください。 左側の [ラボの詳細] ペインには、以下が表示されます。
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウで開く] を選択します)。
ラボでリソースがスピンアップし、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
[ラボの詳細] ペインでもユーザー名を確認できます。
[次へ] をクリックします。
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
[ラボの詳細] ペインでもパスワードを確認できます。
[次へ] をクリックします。
その後次のように進みます。
その後、このタブで Google Cloud コンソールが開きます。
Google Cloud コンソールのナビゲーション メニュー()で、[Vertex AI] > [ワークベンチ] の順にクリックします。
Workbench インスタンスの JupyterLab インターフェースが新しいブラウザタブで開きます。
1. JupyterLab のブラウザタブを閉じて、Workbench のホームページに戻ります。
2. インスタンス名の横にあるチェックボックスをオンにして、[リセット] をクリックします。
3. [JupyterLab を開く] ボタンが再度有効になったら、1 分待ってから [JupyterLab を開く] をクリックします。
[Select Kernel] ダイアログで、使用可能なカーネルのリストから [Python 3] を選択します。
ノートブックの「Getting Started」セクションを実行します。[Project ID] と [Location] は事前構成されています。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
このセクションでは、Gemini でサポートされている複数のモダリティについて説明します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
ClientError 499 応答を受け取った場合は、コードセルを再実行してください。[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
このセクションでは、Gemini を使用して複数のモダリティをインターリーブする方法について説明します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
このセクションでは、Gemini を使用して小売業向けレコメンデーションを行うユースケースについて説明します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
このセクションでは、Gemini を使用して図式を理解し、最適化やコード生成などの実践的な手順を行うユースケースについて説明します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
このセクションでは、Gemini を使用して画像を比較し、オブジェクト間の類似点や相違点を識別するユースケースについて説明します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
このラボでは、マルチモーダル ユースケースで Gemini モデルを使用する方法を学習しました。Gemini の詳細については、以下に示す Vertex AI ドキュメント サイトをご覧ください。
以下のリソースで Gemini に関する理解を深めましょう。
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2025 年 10 月 14 日
ラボの最終テスト日: 2025 年 10 月 14 日
Copyright 2026 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。
このコンテンツは現在ご利用いただけません
利用可能になりましたら、メールでお知らせいたします
ありがとうございます。
利用可能になりましたら、メールでご連絡いたします
1 回に 1 つのラボ
既存のラボをすべて終了して、このラボを開始することを確認してください