加入 登录

Martin Frey

成为会员时间:2023

使用 BigQuery 构建数据仓库 Earned Mar 14, 2026 EDT
创建图片标注模型 Earned Dec 16, 2025 EST
Transformer 模型和 BERT 模型 Earned Dec 15, 2025 EST
编码器-解码器架构 Earned Dec 14, 2025 EST
Serverless Data Processing with Dataflow: Operations Earned Dec 14, 2025 EST
注意力机制 Earned Dec 12, 2025 EST
图像生成简介 Earned Dec 12, 2025 EST
Serverless Data Processing with Dataflow: Develop Pipelines Earned Dec 8, 2025 EST
Serverless Data Processing with Dataflow: Foundations Earned Nov 27, 2025 EST
Preparing for your Professional Data Engineer Journey Earned Nov 27, 2025 EST
Build Streaming Data Pipelines on Google Cloud Earned Nov 26, 2025 EST
生成式 AI 简介 Earned Nov 19, 2025 EST
适用于生成式 AI 的机器学习运维 (MLOps) Earned Nov 19, 2025 EST
生成式 AI 智能体:助力组织转型 Earned Nov 19, 2025 EST
生成式 AI 应用:改变工作方式 Earned Nov 18, 2025 EST
生成式 AI: 全面了解生成式 AI Earned Nov 17, 2025 EST
生成式 AI:剖析基本概念 Earned Nov 16, 2025 EST
Build Batch Data Pipelines on Google Cloud Earned Nov 16, 2025 EST
生成式 AI:不只是聊天机器人 Earned Nov 15, 2025 EST
Build Data Lakes and Data Warehouses on Google Cloud Earned Nov 12, 2025 EST
Google Cloud 数据工程简介 Earned Nov 7, 2025 EST

完成中级技能徽章课程使用 BigQuery 构建数据仓库,展示以下技能: 联接数据以创建新表、排查联接故障、使用并集附加数据、创建日期分区表, 以及在 BigQuery 中使用 JSON、数组和结构体。

了解详情

本课程教您如何使用深度学习来创建图片标注模型。您将了解图片标注模型的不同组成部分,例如编码器和解码器,以及如何训练和评估模型。学完本课程,您将能够自行创建图片标注模型并用来生成图片说明。

了解详情

本课程向您介绍 Transformer 架构和 Bidirectional Encoder Representations from Transformers (BERT) 模型。您将了解 Transformer 架构的主要组成部分,例如自注意力机制,以及该架构如何用于构建 BERT 模型。您还将了解可以使用 BERT 的不同任务,例如文本分类、问答和自然语言推理。完成本课程估计需要大约 45 分钟。

了解详情

本课程简要介绍了编码器-解码器架构,这是一种功能强大且常见的机器学习架构,适用于机器翻译、文本摘要和问答等 sequence-to-sequence 任务。您将了解编码器-解码器架构的主要组成部分,以及如何训练和部署这些模型。在相应的实验演示中,您将在 TensorFlow 中从头编写简单的编码器-解码器架构实现代码,以用于诗歌生成。

了解详情

In the last installment of the Dataflow course series, we will introduce the components of the Dataflow operational model. We will examine tools and techniques for troubleshooting and optimizing pipeline performance. We will then review testing, deployment, and reliability best practices for Dataflow pipelines. We will conclude with a review of Templates, which makes it easy to scale Dataflow pipelines to organizations with hundreds of users. These lessons will help ensure that your data platform is stable and resilient to unanticipated circumstances.

了解详情

本课程将向您介绍注意力机制,这是一种强大的技术,可令神经网络专注于输入序列的特定部分。您将了解注意力的工作原理,以及如何使用它来提高各种机器学习任务的性能,包括机器翻译、文本摘要和问题解答。

了解详情

本课程向您介绍扩散模型。这类机器学习模型最近在图像生成领域展现出了巨大潜力。扩散模型的灵感来源于物理学,特别是热力学。过去几年内,扩散模型成为热门研究主题并在整个行业开始流行。Google Cloud 上许多先进的图像生成模型和工具都是以扩散模型为基础构建的。本课程向您介绍扩散模型背后的理论,以及如何在 Vertex AI 上训练和部署此类模型。

了解详情

In this second installment of the Dataflow course series, we are going to be diving deeper on developing pipelines using the Beam SDK. We start with a review of Apache Beam concepts. Next, we discuss processing streaming data using windows, watermarks and triggers. We then cover options for sources and sinks in your pipelines, schemas to express your structured data, and how to do stateful transformations using State and Timer APIs. We move onto reviewing best practices that help maximize your pipeline performance. Towards the end of the course, we introduce SQL and Dataframes to represent your business logic in Beam and how to iteratively develop pipelines using Beam notebooks.

了解详情

This course is part 1 of a 3-course series on Serverless Data Processing with Dataflow. In this first course, we start with a refresher of what Apache Beam is and its relationship with Dataflow. Next, we talk about the Apache Beam vision and the benefits of the Beam Portability framework. The Beam Portability framework achieves the vision that a developer can use their favorite programming language with their preferred execution backend. We then show you how Dataflow allows you to separate compute and storage while saving money, and how identity, access, and management tools interact with your Dataflow pipelines. Lastly, we look at how to implement the right security model for your use case on Dataflow.

了解详情

This course helps learners create a study plan for the PDE (Professional Data Engineer) certification exam. Learners explore the breadth and scope of the domains covered in the exam. Learners assess their exam readiness and create their individual study plan.

了解详情

In this course you will get hands-on in order to work through real-world challenges faced when building streaming data pipelines. The primary focus is on managing continuous, unbounded data with Google Cloud products.

了解详情

这是一节入门级微课程,旨在解释什么是生成式 AI、它的用途以及与传统机器学习方法的区别。该课程还介绍了可以帮助您开发自己的生成式 AI 应用的各种 Google 工具。

了解详情

本课程致力于为您提供所需的知识和工具,让您能够了解 MLOps 团队在部署和管理生成式 AI 模型以及探索 Vertex AI 如何帮助 AI 团队简化 MLOps 流程时面临的独特挑战,并帮助您在生成式 AI 项目中取得成功。

了解详情

“生成式 AI 智能体:助力组织转型”是“Gen AI Leader”学习路线中的第五门课程,也是最后一门课程。本课程探讨了组织如何使用量身定制的生成式 AI 智能体,帮助应对特定的业务挑战。您将亲自动手构建一个基本的生成式 AI 智能体,并探索这些智能体的组成部分,例如模型、推理循环以及各种工具。

了解详情

“生成式 AI 应用:改变工作方式”是 Generative AI Leader 学习路线的第四门课程。本课程介绍 Google 的生成式 AI 应用,例如 Gemini for Workspace 和 NotebookLM。它将引导您逐一了解接地、检索增强生成、构建有效提示和构建自动化工作流等概念。

了解详情

“生成式 AI: 全面了解生成式 AI”是 Generative AI Leader 学习路线中的第三门课程。生成式 AI 正在改变我们的工作方式,以及我们与周围世界的互动方式。作为领导者,应该如何利用生成式 AI 来推动实现实际的业务成果?在本课程中,您将探索构建生成式 AI 解决方案的不同层级、Google Cloud 的产品,以及选择解决方案时需要考虑的因素。

了解详情

“生成式 AI: 剖析基本概念”是 Generative AI Leader 学习路线中的第二门课程。在本课程中,您将了解生成式 AI 的基本概念。您要探索 AI、机器学习和生成式 AI 之间的区别,了解各种数据类型如何赋能生成式 AI,从而应对各种业务挑战。您还将深入了解 Google Cloud 应对基础模型局限性的策略,以及负责任和安全的 AI 开发与部署面临着哪些关键挑战。

了解详情

In this intermediate course, you will learn to design, build, and optimize robust batch data pipelines on Google Cloud. Moving beyond fundamental data handling, you will explore large-scale data transformations and efficient workflow orchestration, essential for timely business intelligence and critical reporting. Get hands-on practice using Dataflow for Apache Beam and Serverless for Apache Spark (Dataproc Serverless) for implementation, and tackle crucial considerations for data quality, monitoring, and alerting to ensure pipeline reliability and operational excellence. A basic knowledge of data warehousing, ETL/ELT, SQL, Python, and Google Cloud concepts is recommended.

了解详情

“生成式 AI:不只是聊天机器人”是 Generative AI Leader 学习路线中的第一门课程。学习本课程没有知识门槛。本课程旨在帮助您超越对聊天机器人的基本认知,探索生成式 AI技术为您的组织带来的真正潜力。您将探索基础模型和提示工程等概念,这些知识对利用生成式 AI 的强大功能至关重要。本课程还将说明,为组织制定成功的生成式 AI 策略时,需要考虑哪些重要因素。

了解详情

While the traditional approaches of using data lakes and data warehouses can be effective, they have shortcomings, particularly in large enterprise environments. This course introduces the concept of a data lakehouse and the Google Cloud products used to create one. A lakehouse architecture uses open-standard data sources and combines the best features of data lakes and data warehouses, which addresses many of their shortcomings.

了解详情

在本课程中,您将了解 Google Cloud 数据工程、数据工程师的角色和职责,以及相关的 Google Cloud 产品和服务。您还将了解如何应对数据工程挑战。

了解详情