加入 登录

Thierno Diallo

成为会员时间:2025

黄金联赛

13126 积分
在 BigQuery 使用 Gemini 模型 Earned Apr 9, 2026 EDT
透過 Gemini in BigQuery 提升工作效率 Earned Feb 13, 2026 EST
使用 Dataplex 建構資料網格 Earned Feb 3, 2026 EST
透過 BigQuery 建構資料倉儲 Earned Jan 29, 2026 EST
Serverless Data Processing with Dataflow: Operations Earned Jan 27, 2026 EST
Serverless Data Processing with Dataflow: Develop Pipelines Earned Jan 8, 2026 EST
Serverless Data Processing with Dataflow: Foundations Earned Jan 7, 2026 EST
Build Streaming Data Pipelines on Google Cloud Earned Jan 7, 2026 EST
Build Batch Data Pipelines on Google Cloud Earned Dec 23, 2025 EST
Build Data Lakes and Data Warehouses on Google Cloud Earned Dec 8, 2025 EST
Google Cloud 中的資料工程簡介 Earned Dec 3, 2025 EST
開發人員的負責任 AI 技術:可解釋性與透明度 Earned Oct 30, 2025 EDT
開發人員的負責任 AI 技術:公平性與偏誤 Earned Oct 28, 2025 EDT
Vector Search 和嵌入 Earned Oct 24, 2025 EDT
Vertex AI Studio 簡介 Earned Oct 23, 2025 EDT
建立圖像說明生成模型 Earned Oct 23, 2025 EDT
Transformer 和 BERT 模型 Earned Oct 21, 2025 EDT
編碼器-解碼器架構 Earned Oct 21, 2025 EDT
注意力機制 Earned Oct 15, 2025 EDT
圖像生成簡介 Earned Oct 15, 2025 EDT
Preparing for your Professional Data Engineer Journey Earned Mar 10, 2025 EDT

本課程將示範如何在 BigQuery 運用 AI/機器學行模型,以執行生成式 AI 任務。透過涉及顧客關係管理的應用實例,您將瞭解運用 Gemini 模型解決業務問題的工作流程。為了便於理解,本課程還提供了採用 SQL 查詢和 Python 筆記本的程式設計解決方案,指導您逐步操作。

了解详情

本課程會說明 Gemini in BigQuery,這是一套由 AI 輔助的功能,可協助「從資料到 AI」的工作流程。這些功能包含資料探索和準備、程式碼生成和疑難排解,以及工作流程探索和視覺化。本課程將透過概念解說、應用實例和實作實驗室,協助資料從業人員提升工作效率,並加速開發 pipeline。

了解详情

完成「使用 Dataplex 建構資料網格」技能徽章入門課程,即可證明您具備下列技能:使用 Dataplex 建構資料網格, 以利在 Google Cloud 維護資料安全性,並協助治理和探索資料。您將練習並測試自己的技能,包括在 Dataplex 為資產加上標記、指派 IAM 角色,以及評估資料品質。

了解详情

完成 透過 BigQuery 建構資料倉儲 技能徽章中階課程,即可證明您具備下列技能: 彙整資料以建立新資料表、排解彙整作業問題、利用聯集附加資料、建立依日期分區的資料表, 以及在 BigQuery 使用 JSON、陣列和結構體。

了解详情

In the last installment of the Dataflow course series, we will introduce the components of the Dataflow operational model. We will examine tools and techniques for troubleshooting and optimizing pipeline performance. We will then review testing, deployment, and reliability best practices for Dataflow pipelines. We will conclude with a review of Templates, which makes it easy to scale Dataflow pipelines to organizations with hundreds of users. These lessons will help ensure that your data platform is stable and resilient to unanticipated circumstances.

了解详情

In this second installment of the Dataflow course series, we are going to be diving deeper on developing pipelines using the Beam SDK. We start with a review of Apache Beam concepts. Next, we discuss processing streaming data using windows, watermarks and triggers. We then cover options for sources and sinks in your pipelines, schemas to express your structured data, and how to do stateful transformations using State and Timer APIs. We move onto reviewing best practices that help maximize your pipeline performance. Towards the end of the course, we introduce SQL and Dataframes to represent your business logic in Beam and how to iteratively develop pipelines using Beam notebooks.

了解详情

This course is part 1 of a 3-course series on Serverless Data Processing with Dataflow. In this first course, we start with a refresher of what Apache Beam is and its relationship with Dataflow. Next, we talk about the Apache Beam vision and the benefits of the Beam Portability framework. The Beam Portability framework achieves the vision that a developer can use their favorite programming language with their preferred execution backend. We then show you how Dataflow allows you to separate compute and storage while saving money, and how identity, access, and management tools interact with your Dataflow pipelines. Lastly, we look at how to implement the right security model for your use case on Dataflow.

了解详情

In this course you will get hands-on in order to work through real-world challenges faced when building streaming data pipelines. The primary focus is on managing continuous, unbounded data with Google Cloud products.

了解详情

In this intermediate course, you will learn to design, build, and optimize robust batch data pipelines on Google Cloud. Moving beyond fundamental data handling, you will explore large-scale data transformations and efficient workflow orchestration, essential for timely business intelligence and critical reporting. Get hands-on practice using Dataflow for Apache Beam and Serverless for Apache Spark (Dataproc Serverless) for implementation, and tackle crucial considerations for data quality, monitoring, and alerting to ensure pipeline reliability and operational excellence. A basic knowledge of data warehousing, ETL/ELT, SQL, Python, and Google Cloud concepts is recommended.

了解详情

While the traditional approaches of using data lakes and data warehouses can be effective, they have shortcomings, particularly in large enterprise environments. This course introduces the concept of a data lakehouse and the Google Cloud products used to create one. A lakehouse architecture uses open-standard data sources and combines the best features of data lakes and data warehouses, which addresses many of their shortcomings.

了解详情

在本課程中,您會學到 Google Cloud 上的資料工程、資料工程師的角色與職責,以及這些內容如何對應至 Google Cloud 提供的服務。您也將瞭解處理資料工程難題的許多方法。

了解详情

本課程旨在說明 AI 的可解釋性和透明度概念、探討 AI 透明度對開發人員和工程師的重要性。課程中也會介紹實務方法和工具,有助於讓資料和 AI 模型透明且可解釋。

了解详情

本課程旨在說明負責任 AI 技術的概念和 AI 開發原則,同時介紹各項技術,在實務上找出公平性和偏誤,減少 AI/機器學習做法上的偏誤。我們也將探討實用方法和工具,透過 Google Cloud 產品和開放原始碼工具,導入負責任 AI 技術的最佳做法。

了解详情

這堂課程會介紹 AI 搜尋技術、工具和應用程式。主題涵蓋使用向量嵌入執行語意搜尋;結合語意和關鍵字做法的混合型搜尋機制;以及運用檢索增強生成 (RAG) 技術建構有基準的 AI 代理,盡可能減少 AI 幻覺。您可以實際使用 Vertex AI Vector Search,打造智慧型搜尋引擎。

了解详情

本課程會介紹 Vertex AI Studio。您可以運用這項工具和生成式 AI 模型互動、根據商業構想設計原型,並投入到正式環境。透過身歷其境的應用實例、有趣的課程及實作實驗室,您將能探索從提示到正式環境的生命週期,同時學習如何將 Vertex AI Studio 運用在多模態版 Gemini 應用程式、提示設計、提示工程和模型調整。這個課程的目標是讓您能運用 Vertex AI Studio,在專案中發揮生成式 AI 的潛能。

了解详情

本課程說明如何使用深度學習來建立圖像說明生成模型。您將學習圖像說明生成模型的各個不同組成部分,例如編碼器和解碼器,以及如何訓練和評估模型。在本課程結束時,您將能建立自己的圖像說明生成模型,並使用模型產生圖像說明文字。

了解详情

這堂課程將說明變換器架構,以及基於變換器的雙向編碼器表示技術 (BERT) 模型,同時帶您瞭解變換器架構的主要組成 (如自我注意力機制) 和如何用架構建立 BERT 模型。此外,也會介紹 BERT 適用的各種任務,像是文字分類、問題回答和自然語言推論。課程預計約 45 分鐘。

了解详情

本課程概要說明解碼器與編碼器的架構,這種強大且常見的機器學習架構適用於序列對序列的任務,例如機器翻譯、文字摘要和回答問題。您將認識編碼器與解碼器架構的主要元件,並瞭解如何訓練及提供這些模型。在對應的研究室逐步操作說明中,您將學習如何從頭開始使用 TensorFlow 寫程式,導入簡單的編碼器與解碼器架構來產生詩詞。

了解详情

本課程將介紹注意力機制,說明這項強大技術如何讓類神經網路專注於輸入序列的特定部分。此外,也將解釋注意力的運作方式,以及如何使用注意力來提高各種機器學習任務的成效,包括機器翻譯、文字摘要和回答問題。

了解详情

本課程將介紹擴散模型,這是一種機器學習模型,近期在圖像生成領域展現亮眼潛力。概念源自物理學,尤其深受熱力學影響。過去幾年來,在學術界和業界都是炙手可熱的焦點。在 Google Cloud 中,擴散模型是許多先進圖像生成模型和工具的基礎。課程將介紹擴散模型背後的理論,並說明如何在 Vertex AI 上訓練和部署這些模型。

了解详情

This course helps learners create a study plan for the PDE (Professional Data Engineer) certification exam. Learners explore the breadth and scope of the domains covered in the exam. Learners assess their exam readiness and create their individual study plan.

了解详情