
始める前に
- ラボでは、Google Cloud プロジェクトとリソースを一定の時間利用します
- ラボには時間制限があり、一時停止機能はありません。ラボを終了した場合は、最初からやり直す必要があります。
- 画面左上の [ラボを開始] をクリックして開始します
Import libraries and set up the notebook
/ 20
Experiment with entity extraction and document classification
/ 20
Experiment with document question answering and summarization
/ 20
Experiment with table parsing from documents
/ 20
Experiment with document translation and comparison
/ 20
昨今の情報社会では、日々膨大な量のデジタル ドキュメントが生成されています。企業も個人も、メールやレポートから法的契約書や科学論文まで、膨大な量のテキストデータに適切に対応しきれていません。これらのドキュメントから効率的かつ正確に有益な分析情報を抽出することは、非常に重要な課題となっています。
ドキュメント処理には、テキストの抽出、分類、要約、翻訳など、さまざまなタスクが含まれます。従来の方法では、ルールベースのアルゴリズムや統計モデルに依存することが多く、自然言語のニュアンスや複雑さに対応しきれない場合があります。
このラボでは、Vertex AI の Gemini API と Google Gen AI SDK を使用して PDF ドキュメントを処理する方法を学びます。
このラボを開始する前に、以下について理解しておく必要があります。
このラボでは、次の作業を行います。
こちらの説明をお読みください。ラボには時間制限があり、一時停止することはできません。タイマーは、Google Cloud のリソースを利用できる時間を示しており、[ラボを開始] をクリックするとスタートします。
このハンズオンラボでは、シミュレーションやデモ環境ではなく実際のクラウド環境を使って、ラボのアクティビティを行います。そのため、ラボの受講中に Google Cloud にログインおよびアクセスするための、新しい一時的な認証情報が提供されます。
このラボを完了するためには、下記が必要です。
[ラボを開始] ボタンをクリックします。ラボの料金をお支払いいただく必要がある場合は、表示されるダイアログでお支払い方法を選択してください。 左側の [ラボの詳細] ペインには、以下が表示されます。
[Google Cloud コンソールを開く] をクリックします(Chrome ブラウザを使用している場合は、右クリックして [シークレット ウィンドウで開く] を選択します)。
ラボでリソースがスピンアップし、別のタブで [ログイン] ページが表示されます。
ヒント: タブをそれぞれ別のウィンドウで開き、並べて表示しておきましょう。
必要に応じて、下のユーザー名をコピーして、[ログイン] ダイアログに貼り付けます。
[ラボの詳細] ペインでもユーザー名を確認できます。
[次へ] をクリックします。
以下のパスワードをコピーして、[ようこそ] ダイアログに貼り付けます。
[ラボの詳細] ペインでもパスワードを確認できます。
[次へ] をクリックします。
その後次のように進みます。
その後、このタブで Google Cloud コンソールが開きます。
Google Cloud コンソールのナビゲーション メニュー()で、[Vertex AI] > [ワークベンチ] の順にクリックします。
Workbench インスタンスの JupyterLab インターフェースが新しいブラウザタブで開きます。
[Select Kernel] ダイアログで、使用可能なカーネルのリストから [Python 3] を選択します。
ノートブックの「Getting Started」(スタートガイド)セクションと「Import libraries」(ライブラリのインポート)セクションをすべて実行します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
固有表現抽出は、非構造化テキストから特定のフィールドと値を識別する自然言語処理の手法です。たとえば、記入済みのフォームから Key-Value ペアを検索したり、請求書からタイプ別に分類された重要なデータをすべて取得したりできます。
ドキュメント分類とは、ドキュメントのタイプを識別するプロセスです。たとえば、請求書、W-2、領収書などのタイプがあります。
このセクションでは、Gemini を使用してドキュメントから情報を取得する方法の例を確認します。
このセクションでは、Gemini を使用してドキュメントを確認し、指定されたリストからそのタイプを特定する方法を確認します。
これらの手法を連携させて、任意の数のドキュメント タイプを抽出することもできます。たとえば、複数のタイプのドキュメントを処理する場合、各ドキュメントを分類プロンプトとともに Gemini に送信し、その出力に基づいて、どの抽出プロンプトを使用するかを決定するロジックを記述できます。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
このセクションでは、Gemini を使用してドキュメントに関する質問に答え、その内容を要約する方法を確認します。
このセクションでは、Gemini を使用してドキュメントの内容を要約または言い換える方法を確認します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
このセクションでは、Gemini でテーブルの内容を解析し、HTML やマークダウンなどの構造化された形式で出力する方法を確認します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
このセクションでは、Gemini を使用して言語間でドキュメントを翻訳する方法を確認します。
このセクションでは、Gemini を使用して複数のドキュメントの内容を比較する方法を確認します。
[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。
これでラボは完了です。このラボでは、Gemini 2.0 Flash モデルと Google Gen AI SDK を使用して、非構造化ドキュメントから構造化エンティティを抽出しました。
以下のリソースで Gemini に関する理解を深めましょう。
Google Cloud トレーニングと認定資格を通して、Google Cloud 技術を最大限に活用できるようになります。必要な技術スキルとベスト プラクティスについて取り扱うクラスでは、学習を継続的に進めることができます。トレーニングは基礎レベルから上級レベルまであり、オンデマンド、ライブ、バーチャル参加など、多忙なスケジュールにも対応できるオプションが用意されています。認定資格を取得することで、Google Cloud テクノロジーに関するスキルと知識を証明できます。
マニュアルの最終更新日: 2025 年 5 月 19 日
ラボの最終テスト日: 2025 年 5 月 19 日
Copyright 2025 Google LLC. All rights reserved. Google および Google のロゴは Google LLC の商標です。その他すべての企業名および商品名はそれぞれ各社の商標または登録商標です。
このコンテンツは現在ご利用いただけません
利用可能になりましたら、メールでお知らせいたします
ありがとうございます。
利用可能になりましたら、メールでご連絡いたします
1 回に 1 つのラボ
既存のラボをすべて終了して、このラボを開始することを確認してください