Cloud Speech API 3 Ways:挑戰實驗室
实验
45 分钟
universal_currency_alt
1 积分
show_chart
入门级
info
此实验可能会提供 AI 工具来支持您学习。
ARC132

總覽
在挑戰研究室中,您會在特定情境下完成一系列任務。挑戰研究室不會提供逐步說明,您將運用從課程研究室學到的技巧,自行找出方法完成任務!自動評分系統 (如本頁所示) 將根據您是否正確完成任務來提供意見回饋。
在您完成任務的期間,挑戰研究室不會介紹新的 Google Cloud 概念。您須靈活運用所學技巧,例如變更預設值或詳讀並研究錯誤訊息,解決遇到的問題。
若想滿分達標,就必須在時限內成功完成所有任務!
設定和需求
瞭解以下事項後,再點選「Start Lab」按鈕
請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。
您將在真正的雲端環境完成實作實驗室活動,而不是模擬或示範環境。為此,我們會提供新的暫時憑證,供您在實驗室活動期間登入及存取 Google Cloud。
為了順利完成這個實驗室,請先確認:
- 可以使用標準的網際網路瀏覽器 (Chrome 瀏覽器為佳)。
注意事項:請使用無痕模式 (建議選項) 或私密瀏覽視窗執行此實驗室,這可以防止個人帳戶和學員帳戶之間的衝突,避免個人帳戶產生額外費用。
- 是時候完成實驗室活動了!別忘了,活動一旦開始將無法暫停。
注意事項:務必使用實驗室專用的學員帳戶。如果使用其他 Google Cloud 帳戶,可能會產生額外費用。
挑戰情境
您剛開始擔任初階雲端架構師,公司指派您參與團隊專案,需要使用 Google Cloud 的 Cloud Speech API 服務。
公司認為您具備完成下列工作所需的技能與知識。
您的挑戰
在這項挑戰中,您必須使用 Cloud Speech API,將不同語言的語音轉錄成文字。
必要操作:
- 使用 Text-to-Speech API,根據文字合成語音。
- 建立 API 金鑰。
- 使用 Cloud Speech API 將語音轉錄為文字
- 使用 Cloud Translation API 翻譯文字。
- 使用 Cloud Translation API 偵測語言。
在本挑戰實驗室中,我們已設定好虛擬機器 (VM) 執行個體 ,供您用來完成工作 2 到 5。
各項工作的詳細說明如下,祝您好運!
工作 1:建立 API 金鑰
- 在這項工作,您需要建立 API 金鑰,以便在傳送要求至 Speech-to-Text API 時使用。
- 儲存 API 金鑰,以便在其他工作中使用。
點選「Check my progress」,確認目標已達成。
建立 API 金鑰
工作 2:使用 Text-to-Speech API,依據文字合成語音
-
在這項工作中,請透過 SSH 連線至為您佈建的 VM 執行個體 。
-
使用 source venv/bin/activate 指令啟動虛擬環境。
-
使用文字編輯器 (例如 nano 或 vim) 建立名為 synthesize-text.json 的檔案,並將下列內容貼入檔案:
{
'input':{
'text':'Cloud Text-to-Speech API allows developers to include
natural-sounding, synthetic human speech as playable audio in
their applications. The Text-to-Speech API converts text or
Speech Synthesis Markup Language (SSML) input into audio data
like MP3 or LINEAR16 (the encoding used in WAV files).'
},
'voice':{
'languageCode':'en-gb',
'name':'en-GB-Standard-A',
'ssmlGender':'FEMALE'
},
'audioConfig':{
'audioEncoding':'MP3'
}
}
-
呼叫 Text-to-Speech API 合成 synthesize-text.json 檔案中的文字,並將結果儲存至名為 的檔案。
-
使用文字編輯器 (例如 nano 或 vim) 建立名為 tts_decode.py 的檔案,並將下列程式碼貼入該檔案:
import argparse
from base64 import decodebytes
import json
"""
Usage:
python tts_decode.py --input "{{{project_0.startup_script.synthesize_response | Filled in at lab start}}}" \
--output "synthesize-text-audio.mp3"
"""
def decode_tts_output(input_file, output_file):
""" Decode output from Cloud Text-to-Speech.
input_file: the response from Cloud Text-to-Speech
output_file: the name of the audio file to create
"""
with open(input_file) as input:
response = json.load(input)
audio_data = response['audioContent']
with open(output_file, "wb") as new_file:
new_file.write(decodebytes(audio_data.encode('utf-8')))
if __name__ == '__main__':
parser = argparse.ArgumentParser(
description="Decode output from Cloud Text-to-Speech",
formatter_class=argparse.RawDescriptionHelpFormatter)
parser.add_argument('--input',
help='The response from the Text-to-Speech API.',
required=True)
parser.add_argument('--output',
help='The name of the audio file to create',
required=True)
args = parser.parse_args()
decode_tts_output(args.input, args.output)
- 現在,請從 Cloud Shell 執行下列指令,使用 Text-to-Speech API 傳回的回應建立音訊檔案:
python tts_decode.py --input "synthesize-text.txt" --output "synthesize-text-audio.mp3"
這會建立名為 synthesize-text-audio.mp3 的新 MP3 檔案。
- 最後,透過 VM 執行個體 SSH 工作階段的
下載檔案選項下載音訊檔案,即可收聽。
點選「Check my progress」,確認目標已達成。
使用 Text-to-Speech API,將文字轉為合成語音
工作 3:使用 Cloud Speech API 將語音轉錄為文字
注意:本實驗室使用預先錄好的檔案,該檔案可從 Cloud Storage 取得:gs://cloud-samples-data/speech/corbeau_renard.flac。您可以聆聽這個檔案。
-
在這項工作中,請透過 SSH 連線至為您佈建的 VM 執行個體 。
-
使用文字編輯器 (例如 nano 或 vim) 建立名為 的檔案,做為 API 要求,將 gs://cloud-samples-data/speech/corbeau_renard.flac 位置的音訊檔案轉錄成法文。
-
呼叫 ,並將結果儲存至名為 的檔案。
點選「Check my progress」,確認目標已達成。
建立 API 要求,將法文語音轉錄為文字
工作 4:使用 Cloud Translation API 翻譯文字
-
在這項工作中,請透過 SSH 連線至為您佈建的 VM 執行個體 。
-
呼叫 Cloud Translation API,將 這句話翻譯成英文,並將結果儲存至 檔案。
點選「Check my progress」,確認目標已達成。
使用 Cloud Translation API 翻譯文字
工作 5:使用 Cloud Translation API 偵測語言
-
在這項工作中,請透過 SSH 連線至為您佈建的 VM 執行個體 。
-
呼叫 Cloud Translation API,偵測 字句的語言,並將結果儲存至 檔案。
點選「Check my progress」,確認目標已達成。
使用 Cloud Translation API 偵測語言
恭喜!
您已成功使用 Text-to-Speech API 從文字建立合成語音、使用 Cloud Speech API 將語音轉錄成文字,以及使用 Cloud Translation API 翻譯文字和偵測語言。
Google Cloud 教育訓練與認證
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2023 年 11 月 30 日
實驗室上次測試日期:2023 年 12 月 4 日
Copyright 2025 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。