
准备工作
- 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
- 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
- 在屏幕左上角,点击开始实验即可开始
Import libraries and set up the notebook
/ 20
Experiment with entity extraction and document classification
/ 20
Experiment with document question answering and summarization
/ 20
Experiment with table parsing from documents
/ 20
Experiment with document translation and comparison
/ 20
在以資訊為本的現代,每天產生的數位文件數量相當可觀。無論是電子郵件、報表、法律合約或科學論文,企業和個人都忙著處理大量的文字資料。如何高效且準確地從這些文件中擷取出有意義的洞察資料,已成為當務之急。
處理文件時需要執行多種工作,包括擷取、分類、總結及翻譯文字等。傳統方法通常使用以規則為基礎的演算法或統計模型,不過可能難以處理複雜的自然語言及其細微差異。
在這個實驗室,您會瞭解如何搭配使用 Vertex AI 中的 Gemini API 與 Google Gen AI SDK,藉此處理 PDF 文件。
開始這個實驗室之前,您應已熟悉下列概念:
這個實驗室的內容如下:
請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。
您將在真正的雲端環境完成實作實驗室活動,而不是模擬或示範環境。為此,我們會提供新的暫時憑證,供您在實驗室活動期間登入及存取 Google Cloud。
為了順利完成這個實驗室,請先確認:
點選「Start Lab」按鈕。如果實驗室會產生費用,畫面上會出現選擇付款方式的對話方塊。左側的「Lab Details」窗格會顯示下列項目:
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」。
接著,實驗室會啟動相關資源,並開啟另一個分頁,顯示「登入」頁面。
提示:您可以在不同的視窗中並排開啟分頁。
如有必要,請將下方的 Username 貼到「登入」對話方塊。
您也可以在「Lab Details」窗格找到 Username。
點選「下一步」。
複製下方的 Password,並貼到「歡迎使用」對話方塊。
您也可以在「Lab Details」窗格找到 Password。
點選「下一步」。
按過後續的所有頁面:
Google Cloud 控制台稍後會在這個分頁開啟。
前往 Google Cloud 控制台,依序點按「導覽選單」圖示 >「Vertex AI」>「Workbench」。
找出
Workbench 執行個體的 JupyterLab 介面會在新瀏覽器分頁中開啟。
開啟
出現「Select Kernel」對話方塊時,從可用核心清單中選取「Python 3」。
完成筆記本的「Getting Started」和「Import libraries」部分。
點選「Check my progress」,確認目標已達成。
命名實體擷取是一項自然語言處理技術,可以從非結構化文字中辨識出具體欄位和值。舉例來說,您可以從填妥的表單中找出鍵/值組合,或是從按照類型分類的應付憑據中取得所有重要資料。
文件分類是指識別文件類型的程序,例如應付憑據、W-2 表單、收據等。
在這個部分,您會參考示例,瞭解如何運用 Gemini 從文件中擷取出資訊。
在這個部分,您會瞭解如何運用 Gemini 檢查文件,並從指定清單中指定文件類型。
您也可以將這些技術相互鏈結,擷取任意數量的文件類型。舉例來說,假設您要處理多個類型的文件,可以將各個文件傳送給 Gemini 並附上分類提示,然後依據輸出內容編寫邏輯,決定要使用的擷取提示。
點選「Check my progress」,確認目標已達成。
在這個部分,您會瞭解如何讓 Gemini 回答文件的問題,並總結文件內容的重點。
在這個部分,您會瞭解如何運用 Gemini 總結或改寫文件內容。
點選「Check my progress」,確認目標已達成。
在這個部分,您會瞭解 Gemini 如何剖析資料表內容,並以 HTML 或 Markdown 等結構化格式傳回結果。
點選「Check my progress」,確認目標已達成。
在這個部分,您會瞭解 Gemini 如何將文件翻譯成不同語言。
在這個部分,您會瞭解 Gemini 如何比較及對比多份文件的內容。
點選「Check my progress」,確認目標已達成。
您已完成這個實驗室,並使用 Gemini 2.0 Flash 模型與 Google Gen AI SDK,從非結構化文件擷取出結構化實體。
歡迎參考下列資源,進一步瞭解 Gemini:
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2025 年 5 月 19 日
實驗室上次測試日期:2025 年 5 月 19 日
Copyright 2025 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
一次一个实验
确认结束所有现有实验并开始此实验