Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create an API Key
/ 30
Upload image to a bucket
/ 30
Analyzing the image's text with the Natural Language API
/ 40
在本實驗室,您將搭配使用多個機器學習 API,探索機器學習技術的強大功能。首先,您將使用 Cloud Vision API 的文字偵測方法,透過光學字元辨識 (OCR) 技術從圖片中擷取文字。接著,您會學到如何使用 Translation API 翻譯該文字,並透過 Natural Language API 分析。
本實驗室的學習內容如下:
請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。
您將在真正的雲端環境完成實作實驗室活動,而不是模擬或示範環境。為此,我們會提供新的暫時憑證,供您在實驗室活動期間登入及存取 Google Cloud。
為了順利完成這個實驗室,請先確認:
點選「Start Lab」按鈕。如果實驗室會產生費用,畫面上會出現選擇付款方式的對話方塊。左側的「Lab Details」窗格會顯示下列項目:
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」。
接著,實驗室會啟動相關資源,並開啟另一個分頁,顯示「登入」頁面。
提示:您可以在不同的視窗中並排開啟分頁。
如有必要,請將下方的 Username 貼到「登入」對話方塊。
您也可以在「Lab Details」窗格找到 Username。
點選「下一步」。
複製下方的 Password,並貼到「歡迎使用」對話方塊。
您也可以在「Lab Details」窗格找到 Password。
點選「下一步」。
按過後續的所有頁面:
Google Cloud 控制台稍後會在這個分頁開啟。
Cloud Shell 是搭載多項開發工具的虛擬機器,提供永久的 5 GB 主目錄,而且在 Google Cloud 中運作。Cloud Shell 提供指令列存取權,方便您使用 Google Cloud 資源。
點按 Google Cloud 控制台頂端的「啟用 Cloud Shell」圖示 。
系統顯示視窗時,請按照下列步驟操作:
連線建立完成即代表已通過驗證,而且專案已設為您的 Project_ID:
gcloud 是 Google Cloud 的指令列工具,已預先安裝於 Cloud Shell,並支援 Tab 鍵自動完成功能。
輸出內容:
輸出內容:
gcloud 的完整說明,請前往 Google Cloud 參閱 gcloud CLI 總覽指南。
您將使用 curl 向 Vision API 傳送要求,因此必須產生 API 金鑰來傳遞要求網址。
依序前往「導覽選單」>「API 和服務」>「憑證」,建立 API 金鑰。
按一下「+ 建立憑證」。
在下拉式選單中,選取「API 金鑰」。
複製剛才產生的金鑰,然後點按「關閉」。
請將 API 金鑰儲存為環境變數,這樣就不必在每個要求插入金鑰值。
在 Cloud Shell 執行下列指令,將 <your_api_key> 替換成剛才複製的金鑰:
點選「Check my progress」,確認工作已完成。
將圖片傳送至 Vision API 進行偵測的方式有兩種:將採用 Base64 編碼的圖片字串傳送至 API,或是傳送儲存在 Cloud Storage 的檔案網址。在本實驗室,您將建立 Cloud Storage bucket 來儲存圖片。
前往控制台的「導覽選單」 >「Cloud Storage」瀏覽器,然後點選「建立 bucket」。
為 bucket 取一個不重複的名稱:
命名後,點按「選取如何控制物件的存取權」。
取消勾選「強制禁止公開存取這個 bucket」方塊。
在「存取控管」下方選擇「精細」,然後點按「建立」。
接著要允許公開查看檔案,同時維持 bucket 的私人存取權設定。
選取「編輯存取權」。
點按「新增項目」,然後設定下列項目:
現在您會看到檔案已具備公開存取權。
現在檔案已加入 bucket,您可以建立 Vision API 要求,傳送圖片的網址了。
點選「Check my progress」,確認工作已完成。
ocr-request.json 檔案,然後將下列程式碼新增至檔案,並將「my-bucket-name」替換為您建立的 bucket 名稱。您可以使用偏好的指令列編輯器 (例如 nano、vim、emacs) 建立檔案,或點按鉛筆圖示,在 Cloud Shell 開啟程式碼編輯器:ocr-request.json 檔案:接下來要使用 Cloud Vision API 的 TEXT_DETECTION 功能,對圖片執行光學字元辨識 (OCR),以擷取文字。
curl 呼叫 Cloud Vision API:回應的第一部分應如下所示:
OCR 方法可從圖片中擷取大量文字。
從 textAnnotations 傳回的第一筆資料是 API 在圖片中找到的整段文字,其中包括:
接著,您會取得一個物件,其中包含在文字中找到的每個字詞,以及該字詞的定界框。
除非您會法文,否則可能不知道這句話的意思,因此下一步是翻譯。
curl 指令,將回應儲存至 ocr-response.json 檔案,以便稍後參照:Translation API 可將文字翻譯成超過 100 種語言,還能偵測輸入文字的語言。如要將法文文字翻譯成英文,請將文字和目標語言的語言代碼 (en-US) 傳送至 Translation API。
translation-request.json 檔案,並加入下列內容:q 用來放置要翻譯的字串。
儲存檔案。
在 Cloud Shell 執行下列 Bash 指令,從上一個步驟擷取圖片文字,並複製到新的 translation-request.json 檔案 (只需一個指令即可完成):
translation-response.json 檔案:這下您就能看懂招牌上的更多內容了!
在回應中:
translatedText 包含翻譯結果detectedSourceLanguage 是 fr,即法文的 ISO 語言代碼。Translation API 支援超過 100 種語言,詳情請見語言支援參考頁面。
除了翻譯圖片中的文字,您可能還想進一步分析內容,這時 Natural Language API 就能派上用場。接著就來進行下一個步驟!
Natural Language API 能擷取實體、分析情緒和語法,並將文字分類,幫助您理解文本。使用 analyzeEntities 方法,即可查看 Natural Language API 從圖片文字中找到哪些實體。
nl-request.json 檔案,並加入下列內容:這項要求會將文字資訊提供給 Natural Language API:
type:支援的類型值為 PLAIN_TEXT 或 HTML。
content:將要分析的文字傳遞至 Natural Language API。Natural Language API 也能處理儲存在 Cloud Storage 的文字檔案。如要傳送 Cloud Storage 中的檔案,請將 content 替換為 gcsContentUri,並將值設為文字檔案在 Cloud Storage 中的 URI。
encodingType:指示 API 要使用哪種文字編碼來處理文字。API 會依照該方法計算特定實體在文字中出現的位置。
nl-request.json 檔案現在已包含原始圖片文字的英文譯文,接著就來分析吧!
curl 要求,呼叫 Natural Language API 的 analyzeEntities 端點:捲動查看回應,即可看到 Natural Language API 找到的實體:
對於有維基百科頁面的實體,API 會提供中繼資料,包括該頁面的網址和實體的 mid。mid 是 Google 知識圖譜中對應至該實體的 ID。如要取得更多資訊,可以呼叫 Knowledge Graph API 並傳遞這個 ID。Natural Language API 會針對所有實體,提供實體在文字中出現的位置 (mentions)、實體類型 (type),以及顯著性 (salience) (介於 0 到 1 之間,表示實體在整段文字中的重要性)。除了英文,Natural Language API 也支援語言支援參考頁面列出的語言。
從這張圖片找出重要實體相對容易,但如果圖片庫含有數千張圖片,這項工作的難度就會大增。這時就能利用 OCR、翻譯和自然語言處理技術,從大量圖片資料集中擷取意義。
點選「Check my progress」,確認工作已完成。
您已學會如何搭配使用 3 種不同的機器學習 API 了:Vision API 的 OCR 方法可從圖片擷取文字,Translation API 則能將該文字翻譯成英文,而 Natural Language API 可找出該文字中的實體。只要同時使用這幾個 API,就能從大型圖片資料集中擷取有意義的資訊。
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2024 年 10 月 22 日
實驗室上次測試日期:2024 年 10 月 22 日
Copyright 2026 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
This content is not currently available
We will notify you via email when it becomes available
Great!
We will contact you via email if it becomes available
One lab at a time
Confirm to end all existing labs and start this one