arrow_back

简要介绍使用 Gemini 进行函数调用

登录 加入
访问 700 多个实验和课程

简要介绍使用 Gemini 进行函数调用

实验 1 小时 universal_currency_alt 5 个积分 show_chart 中级
info 此实验可能会提供 AI 工具来支持您学习。
访问 700 多个实验和课程

GSP1227

Google Cloud 自学实验的徽标

概览

借助函数调用,开发者可以在代码中创建函数的说明,然后通过请求将该说明传递给语言模型。模型的响应包括与说明匹配的函数名称以及用于调用该函数的参数。

函数调用与 Vertex AI 扩展程序的类似之处,在于它们都会生成有关函数的信息。二者的区别在于,函数调用返回的是 JSON 数据,其中包含函数的名称和要在代码中使用的参数,而 Vertex AI 扩展程序返回的是函数,并且会直接调用该函数。

Gemini

Gemini 是 Google DeepMind 开发的一系列强大的生成式 AI 模型,能够理解和生成各种形式的内容,包括文本、代码、图片、音频和视频。

Vertex AI 中的 Gemini API

Vertex AI 中的 Gemini API 提供了与各 Gemini 模型交互的统一接口。通过 Gemini API,开发者可以轻松将这些强大的 AI 功能集成到他们的应用中。如需了解最新版本的最新详细信息和具体功能,请参阅官方 Gemini 文档

Gemini 模型

  • Gemini Pro:专为复杂的推理任务而设计,包括:
    • 分析和总结大量信息。
    • 复杂的跨模态推理(跨文本、代码、图片等)。
    • 有效解决复杂代码库的问题。
  • Gemini Flash:针对速度和效率进行了优化,具有以下特点和功能:
    • 亚秒级响应时间和高吞吐量。
    • 成本低、效率高,适用于各种任务。
    • 增强的多模态功能,包括改进的空间理解、新的输出模态(文本、音频、图片)以及原生工具使用体验(Google 搜索、代码执行和第三方功能)。

前提条件

在开始本实验之前,您应该先熟悉:

  • Python 编程基础知识。
  • API 的一般性概念。
  • Vertex AI Workbench 上的 Jupyter 笔记本中运行 Python 代码

目标

在本实验中,您将学习如何完成以下操作:

  • 安装 Google Gen AI SDK for Python
  • 使用 Vertex AI 中的 Gemini API 与 Gemini 2.0 Flash (gemini-2.0-flash) 模型进行交互:
    • 根据文本提示生成函数调用,帮助客户获取有关 Google 商店中商品的信息
    • 根据文本提示生成函数调用,并调用外部 API 来对地址进行地理编码
    • 根据文本提示生成函数调用,以从日志数据中提取实体

设置和要求

点击“开始实验”按钮前的注意事项

请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。

此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。为此,我们会向您提供新的临时凭据,您可以在该实验的规定时间内通过此凭据登录和访问 Google Cloud。

为完成此实验,您需要:

  • 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
注意:请使用无痕模式(推荐)或无痕浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。
  • 完成实验的时间 - 请注意,实验开始后无法暂停。
注意:请仅使用学生账号完成本实验。如果您使用其他 Google Cloud 账号,则可能会向该账号收取费用。

如何开始实验并登录 Google Cloud 控制台

  1. 点击开始实验按钮。如果该实验需要付费,系统会打开一个对话框供您选择支付方式。左侧是“实验详细信息”窗格,其中包含以下各项:

    • “打开 Google Cloud 控制台”按钮
    • 剩余时间
    • 进行该实验时必须使用的临时凭据
    • 帮助您逐步完成本实验所需的其他信息(如果需要)
  2. 点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。

    该实验会启动资源并打开另一个标签页,显示“登录”页面。

    提示:将这些标签页安排在不同的窗口中,并排显示。

    注意:如果您看见选择账号对话框,请点击使用其他账号
  3. 如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。

    {{{user_0.username | "<用户名>"}}}

    您也可以在“实验详细信息”窗格中找到“用户名”。

  4. 点击下一步

  5. 复制下面的密码,然后将其粘贴到欢迎对话框中。

    {{{user_0.password | "<密码>"}}}

    您也可以在“实验详细信息”窗格中找到“密码”。

  6. 点击下一步

    重要提示:您必须使用实验提供的凭据。请勿使用您的 Google Cloud 账号凭据。 注意:在本实验中使用您自己的 Google Cloud 账号可能会产生额外费用。
  7. 继续在后续页面中点击以完成相应操作:

    • 接受条款及条件。
    • 由于这是临时账号,请勿添加账号恢复选项或双重验证。
    • 请勿注册免费试用。

片刻之后,系统会在此标签页中打开 Google Cloud 控制台。

注意:如需访问 Google Cloud 产品和服务,请点击导航菜单,或在搜索字段中输入服务或产品的名称。 “导航菜单”图标和“搜索”字段

任务 1. 在 Vertex AI Workbench 中打开笔记本

  1. 在 Google Cloud 控制台的导航菜单 (“导航菜单”图标) 中依次点击 Vertex AI > Workbench

  2. 找到 实例,然后点击打开 JupyterLab 按钮。

Workbench 实例的 JupyterLab 界面会在新浏览器标签页中打开。

注意:如果您在 JupyterLab 中没有看到笔记本,请按照以下额外步骤重置实例:

1. 关闭 JupyterLab 的浏览器标签页,然后返回 Workbench 首页。

2. 选中实例名称旁边的复选框,然后点击重置

3. 打开 JupyterLab 按钮重新启用后,请等待一分钟,然后点击打开 JupyterLab

任务 2. 设置笔记本

  1. 打开 文件。

  2. 选择内核对话框中,从可用内核列表中选择 Python 3

  3. 运行笔记本的开始使用导入库部分。

    • 对于项目 ID,请使用 ;对于位置,使用
注意:您可以跳过任何标为“仅限 Colab”的笔记本单元。 如有笔记本单元在执行时遇到 429 响应,请等待 1 分钟,然后再次运行该单元以继续操作。

在后续部分中,您将运行各个笔记本单元,了解如何将 Vertex AI 中的 Gemini API 与 Google Gen AI SDK for Python 搭配使用。

点击检查我的进度以验证是否完成了以下目标: 安装 Gen AI SDK for Python 并导入库

任务 3. 为结构化 Google 商店查询使用函数调用

使用生成式文本模型时,很难强行让 LLM 以结构化的格式(例如 JSON)给出一致的回答。凭借函数调用,您可以通过提示和非结构化输入轻松使用 LLM,并让 LLM 返回可用于调用外部函数的结构化响应。

您可以将函数调用看作是一种通过用户提示和函数定义获得结构化输出的方式,通过使用这一结构化输出向外部系统发出 API 请求,然后将函数响应返回 LLM,便可以为用户生成回答。换句话讲,Gemini 中的函数调用会从用户的非结构化文本或消息中提取结构化的参数。在此示例中,您将使用函数调用以及 Gemini 模型中的聊天模态来帮助客户获取 Google 商店中商品的相关信息。

  1. 在此任务中,运行笔记本单元,了解如何使用 Gemini 模型帮助客户获取 Google 商店中商品的相关信息。

点击检查我的进度以验证是否完成了以下目标: 生成一个简单的函数调用

任务 4. 使用函数调用,通过一个地图 API 对地址进行地理编码

在此示例中,您将使用 Gemini API 中的文本模态来定义一个函数,此函数可接受多个输入参数。您将使用函数调用响应来进行实时 API 调用,以将地址转换为经纬度坐标。

  1. 在此任务中,您将运行各个笔记本单元,了解如何使用 Gemini Flash 模型来生成函数调用,以便对某个地址进行地理编码。
这里我们使用了 OpenStreetMap Nominatim API 对地址进行地理编码,以便在此笔记本中轻松使用和学习。如果您要处理大量地图或者地理定位数据,可使用 Google Maps Geocoding API

点击检查我的进度以验证是否完成了以下目标: 生成一个复杂的函数调用

任务 5. 使用函数调用进行实体提取

在前面的示例中,您使用了 Gemini 函数调用中的实体提取功能,以便将生成的参数传递给 REST API 或客户端库。但是,您可能只想通过 Gemini 函数调用执行实体提取这一个步骤,而不实际调用 API。您可以将此功能视为一种将非结构化文本数据转换为结构化字段的便捷方式。

在此示例中,您将构建一个日志提取器,用于获取原始日志数据,并将其转换为包含错误消息详情的结构化数据。

  1. 在此任务中,您将运行各个笔记本单元,了解如何使用 Gemini Flash 模型生成函数调用,以从日志数据中提取实体。

点击检查我的进度以验证是否完成了以下目标: 通过聊天提示生成函数调用

恭喜!

恭喜!在本实验中,您学习了如何使用 Vertex AI 中的 Gemini API 来根据文本提示生成函数调用。您使用了 Gemini Flash 模型来生成了函数调用,以帮助客户获取 Google 商店中商品的相关信息,对地址进行了地理编码,并从日志数据中提取了实体。

后续步骤/了解详情

请参阅以下资源,详细了解 Gemini:

Google Cloud 培训和认证

…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。

本手册的最后更新时间:2025 年 5 月 14 日

本实验的最后测试时间:2025 年 5 月 14 日

版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

请使用无痕模式或无痕式浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。