Cloud Speech API:3 种使用方式:实验室挑战赛
实验
15 分钟
universal_currency_alt
1 个点数
show_chart
入门级
info
此实验可能会提供 AI 工具来支持您学习。
此内容尚未针对移动设备进行优化。
为获得最佳体验,请在桌面设备上访问通过电子邮件发送的链接。
ARC132

概览
在实验室挑战赛中,我们会为您提供一个场景和一系列任务。您将使用从课程的各个实验中学到的技能自行确定如何完成这些任务,而不是按照分步说明进行操作。自动评分系统(显示在本页面中)会提供有关您是否已正确完成任务的反馈。
在您参加实验室挑战赛期间,我们不会再教授新的 Google Cloud 概念知识。您需要拓展所学的技能,例如通过更改默认值和查看并研究错误消息来更正您自己所犯的错误。
要想获得满分,您必须在该时间段内成功完成所有任务!
设置和要求
点击“开始实验”按钮前的注意事项
请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。
此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。
为完成此实验,您需要:
- 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
注意:请使用无痕模式(推荐)或无痕浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。
注意:请仅使用学生账号完成本实验。如果您使用其他 Google Cloud 账号,则可能会向该账号收取费用。
挑战场景
您刚刚开始担任初级云架构师。作为一名云架构师,您需要参与一个团队项目,该项目要求您使用 Google Cloud 的 Cloud Speech API 服务。
您应该掌握了完成这些任务所需的技能和知识。
您的挑战
在此挑战中,您需要使用 Cloud Speech API 将不同语言的语音转写为文本。
您需要执行的操作:
- 使用 Text-to-Speech API 根据文本创建合成语音。
- 创建 API 密钥。
- 使用 Cloud Speech API 进行语音转文字。
- 使用 Cloud Translation API 翻译文本。
- 使用 Cloud Translation API 检测语言。
在此实验室挑战赛中,系统已为您配置名为 的虚拟机 (VM) 实例,以便您完成任务 2 到任务 5。
下文详细说明了您的每项任务,祝您好运!
任务 1. 创建 API 密钥
- 对于此任务,您需要创建一个 API 密钥。在此任务和其他任务中向 Speech-to-Text API 发送请求时,需要使用该密钥。
- 保存 API 密钥,以便在其他任务中使用。
点击检查我的进度以验证是否完成了以下目标:
创建 API 密钥
任务 2. 使用 Text-to-Speech API 根据文本创建合成语音
-
在此任务中,您需要通过 SSH 连接到为您预配的虚拟机实例 。
-
使用 source venv/bin/activate 命令激活虚拟环境。
-
使用文本编辑器(例如 nano 或 vim)创建一个名为 synthesize-text.json 的文件,并将以下内容粘贴到该文件中:
{
'input':{
'text':'Cloud Text-to-Speech API allows developers to include
natural-sounding, synthetic human speech as playable audio in
their applications. The Text-to-Speech API converts text or
Speech Synthesis Markup Language (SSML) input into audio data
like MP3 or LINEAR16 (the encoding used in WAV files).'
},
'voice':{
'languageCode':'en-gb',
'name':'en-GB-Standard-A',
'ssmlGender':'FEMALE'
},
'audioConfig':{
'audioEncoding':'MP3'
}
}
-
调用 Text-to-Speech API 来合成 synthesize-text.json 文件中的文本,并将结果存储在名为 的文件中。
-
使用文本编辑器(例如 nano 或 vim)创建一个名为 tts_decode.py 的文件,并将以下代码粘贴到该文件中:
import argparse
from base64 import decodebytes
import json
"""
Usage:
python tts_decode.py --input "{{{project_0.startup_script.synthesize_response | Filled in at lab start}}}" \
--output "synthesize-text-audio.mp3"
"""
def decode_tts_output(input_file, output_file):
""" Decode output from Cloud Text-to-Speech.
input_file: the response from Cloud Text-to-Speech
output_file: the name of the audio file to create
"""
with open(input_file) as input:
response = json.load(input)
audio_data = response['audioContent']
with open(output_file, "wb") as new_file:
new_file.write(decodebytes(audio_data.encode('utf-8')))
if __name__ == '__main__':
parser = argparse.ArgumentParser(
description="Decode output from Cloud Text-to-Speech",
formatter_class=argparse.RawDescriptionHelpFormatter)
parser.add_argument('--input',
help='The response from the Text-to-Speech API.',
required=True)
parser.add_argument('--output',
help='The name of the audio file to create',
required=True)
args = parser.parse_args()
decode_tts_output(args.input, args.output)
- 现在,要使用从 Text-to-Speech API 收到的响应创建音频文件,在 Cloud Shell 中运行以下命令:
python tts_decode.py --input "synthesize-text.txt" --output "synthesize-text-audio.mp3"
这会创建一个名为 synthesize-text-audio.mp3 的新 MP3 文件。
- 最后,通过虚拟机实例 SSH 会话中的
下载文件选项下载音频文件,以便收听。
点击检查我的进度以验证是否完成了以下目标:
使用 Text-to-Speech API 根据文本创建合成语音
任务 3. 使用 Cloud Speech API 进行语音转文字
注意:本实验使用 Cloud Storage 中预先录制的文件:gs://cloud-samples-data/speech/corbeau_renard.flac。您可以听一下该文件。
-
在此任务中,您需要通过 SSH 连接到为您预配的虚拟机实例 。
-
使用文本编辑器(例如 nano 或 vim)创建一个名为 的文件,作为 API 请求,将 gs://cloud-samples-data/speech/corbeau_renard.flac 音频文件转写为法语。
-
调用 并将结果存储在名为 的文件中。
点击检查我的进度以验证是否完成了以下目标:
创建用于转写法语音频的 API 请求
任务 4. 使用 Cloud Translation API 翻译文本
-
在此任务中,您需要通过 SSH 连接到为您预配的虚拟机实例 。
-
调用 Cloud Translation API 将 句子翻译为英语,并将结果存储在 文件中。
点击检查我的进度以验证是否完成了以下目标:
使用 Cloud Translation API 翻译文本
任务 5. 使用 Cloud Translation API 检测语言
-
在此任务中,您需要通过 SSH 连接到为您预配的虚拟机实例 。
-
调用 Cloud Translation API 检测 句子的语言,并将结果存储在 文件中。
点击检查我的进度以验证是否完成了以下目标:
使用 Cloud Translation API 检测语言
恭喜!
您已成功使用 Text-to-Speech API 根据文本创建合成语音,使用 Cloud Speech API 将语音转写为文本,以及使用 Cloud Translation API 翻译文本并检测语言。
Google Cloud 培训和认证
…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。
本手册的最后更新时间:2023 年 11 月 30 日
本实验的最后测试时间:2023 年 12 月 4 日
版权所有 2026 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。