Huang Pan
Member since 2023
Member since 2023
In this course, you will be learning from ML Engineers and Trainers who work with the state-of-the-art development of ML pipelines here at Google Cloud. The first few modules will cover about TensorFlow Extended (or TFX), which is Google’s production machine learning platform based on TensorFlow for management of ML pipelines and metadata. You will learn about pipeline components and pipeline orchestration with TFX. You will also learn how you can automate your pipeline through continuous integration and continuous deployment, and how to manage ML metadata. Then we will change focus to discuss how we can automate and reuse ML pipelines across multiple ML frameworks such as tensorflow, pytorch, scikit learn, and xgboost. You will also learn how to use another tool on Google Cloud, Cloud Composer, to orchestrate your continuous training pipelines. And finally, we will go over how to use MLflow for managing the complete machine learning life cycle.
This course takes a real-world approach to the ML Workflow through a case study. An ML team faces several ML business requirements and use cases. The team must understand the tools required for data management and governance and consider the best approach for data preprocessing. The team is presented with three options to build ML models for two use cases. The course explains why they would use AutoML, BigQuery ML, or custom training to achieve their objectives.
This course introduces participants to MLOps tools and best practices for deploying, evaluating, monitoring and operating production ML systems on Google Cloud. MLOps is a discipline focused on the deployment, testing, monitoring, and automation of ML systems in production. Machine Learning Engineering professionals use tools for continuous improvement and evaluation of deployed models. They work with (or can be) Data Scientists, who develop models, to enable velocity and rigor in deploying the best performing models.
This course covers how to implement the various flavors of production ML systems— static, dynamic, and continuous training; static and dynamic inference; and batch and online processing. You delve into TensorFlow abstraction levels, the various options for doing distributed training, and how to write distributed training models with custom estimators. This is the second course of the Advanced Machine Learning on Google Cloud series. After completing this course, enroll in the Image Understanding with TensorFlow on Google Cloud course.
This course explores the benefits of using Vertex AI Feature Store, how to improve the accuracy of ML models, and how to find which data columns make the most useful features. This course also includes content and labs on feature engineering using BigQuery ML, Keras, and TensorFlow.
This course covers building ML models with TensorFlow and Keras, improving the accuracy of ML models and writing ML models for scaled use.
The course begins with a discussion about data: how to improve data quality and perform exploratory data analysis. We describe Vertex AI AutoML and how to build, train, and deploy an ML model without writing a single line of code. You will understand the benefits of Big Query ML. We then discuss how to optimize a machine learning (ML) model and how generalization and sampling can help assess the quality of ML models for custom training.
This course explores what ML is and what problems it can solve. The course also discusses best practices for implementing machine learning. You’re introduced to Vertex AI, a unified platform to quickly build, train, and deploy AutoML machine learning models. The course discusses the five phases of converting a candidate use case to be driven by machine learning, and why it’s important to not skip them. The course ends with recognizing the biases that ML can amplify and how to recognize them.
In the last installment of the Dataflow course series, we will introduce the components of the Dataflow operational model. We will examine tools and techniques for troubleshooting and optimizing pipeline performance. We will then review testing, deployment, and reliability best practices for Dataflow pipelines. We will conclude with a review of Templates, which makes it easy to scale Dataflow pipelines to organizations with hundreds of users. These lessons will help ensure that your data platform is stable and resilient to unanticipated circumstances.
In this second installment of the Dataflow course series, we are going to be diving deeper on developing pipelines using the Beam SDK. We start with a review of Apache Beam concepts. Next, we discuss processing streaming data using windows, watermarks and triggers. We then cover options for sources and sinks in your pipelines, schemas to express your structured data, and how to do stateful transformations using State and Timer APIs. We move onto reviewing best practices that help maximize your pipeline performance. Towards the end of the course, we introduce SQL and Dataframes to represent your business logic in Beam and how to iteratively develop pipelines using Beam notebooks.
This course is part 1 of a 3-course series on Serverless Data Processing with Dataflow. In this first course, we start with a refresher of what Apache Beam is and its relationship with Dataflow. Next, we talk about the Apache Beam vision and the benefits of the Beam Portability framework. The Beam Portability framework achieves the vision that a developer can use their favorite programming language with their preferred execution backend. We then show you how Dataflow allows you to separate compute and storage while saving money, and how identity, access, and management tools interact with your Dataflow pipelines. Lastly, we look at how to implement the right security model for your use case on Dataflow.
Incorporating machine learning into data pipelines increases the ability to extract insights from data. This course covers ways machine learning can be included in data pipelines on Google Cloud. For little to no customization, this course covers AutoML. For more tailored machine learning capabilities, this course introduces Notebooks and BigQuery machine learning (BigQuery ML). Also, this course covers how to productionalize machine learning solutions by using Vertex AI.
In this course you will get hands-on in order to work through real-world challenges faced when building streaming data pipelines. The primary focus is on managing continuous, unbounded data with Google Cloud products.
In this intermediate course, you will learn to design, build, and optimize robust batch data pipelines on Google Cloud. Moving beyond fundamental data handling, you will explore large-scale data transformations and efficient workflow orchestration, essential for timely business intelligence and critical reporting. Get hands-on practice using Dataflow for Apache Beam and Serverless for Apache Spark (Dataproc Serverless) for implementation, and tackle crucial considerations for data quality, monitoring, and alerting to ensure pipeline reliability and operational excellence. A basic knowledge of data warehousing, ETL/ELT, SQL, Python, and Google Cloud concepts is recommended.
While the traditional approaches of using data lakes and data warehouses can be effective, they have shortcomings, particularly in large enterprise environments. This course introduces the concept of a data lakehouse and the Google Cloud products used to create one. A lakehouse architecture uses open-standard data sources and combines the best features of data lakes and data warehouses, which addresses many of their shortcomings.
This course introduces the Google Cloud big data and machine learning products and services that support the data-to-AI lifecycle. It explores the processes, challenges, and benefits of building a big data pipeline and machine learning models with Vertex AI on Google Cloud.
This course helps learners create a study plan for the PDE (Professional Data Engineer) certification exam. Learners explore the breadth and scope of the domains covered in the exam. Learners assess their exam readiness and create their individual study plan.
בקורס הזה נלמד על Generative AI Studio, מוצר ב-Vertex AI שעוזר ליצור אבות טיפוס למודלים של בינה מלאכותית גנרטיבית, כדי להשתמש בהם ולהתאים אותם לפי הצרכים שלכם. באמצעות הדגמה של המוצר עצמו, נלמד מהו Generative AI Studio, מהם הפיצ'רים והאפשרויות שלו, ואיך להשתמש בו. בסוף הקורס יהיה שיעור Lab מעשי לתרגול של מה שנלמד, ובוחן לבדיקת הידע.
רוצים לקבל תג מיומנות? אפשר להשלים את הקורסים Introduction to Generative AI, Introduction to Large Language Models ו-Introduction to Responsible AI. מעבר של המבחן המסכם מוכיח שהבנתם את המושגים הבסיסיים בבינה מלאכותית גנרטיבית. 'תג מיומנות' הוא תג דיגיטלי ש-Google מנפיקה, שמוכיח שאתם מכירים את המוצרים והשירותים של Google Cloud. כדי לשתף את תג המיומנות אפשר להפוך את הפרופיל שלכם לגלוי לכולם ולהוסיף אותו לפרופיל שלכם ברשתות חברתיות.
זהו קורס מבוא ממוקד שמטרתו להסביר מהי אתיקה של בינה מלאכותית, למה היא חשובה ואיך Google נוהגת לפי כללי האתיקה של הבינה המלאכותית במוצרים שלה. מוצגים בו גם 7 עקרונות ה-AI של Google.
בקורס הזה לומדים בקצרה על ארכיטקטורת מקודד-מפענח, ארכיטקטורה עוצמתית ונפוצה ללמידת מכונה שמשתמשים בה במשימות של רצף לרצף, כמו תרגום אוטומטי, סיכום טקסט ומענה לשאלות. תלמדו על החלקים השונים בארכיטקטורת מקודד-מפענח, איך לאמן את המודלים האלה ואיך להשתמש בהם. בהדרכה המפורטת המשלימה בשיעור ה-Lab תקודדו ב-TensorFlow תרחיש שימוש פשוט בארכיטקטורת מקודד-מפענח: כתיבת שיר מאפס.
בקורס הזה תלמדו איך ליצור מודל הוספת כיתוב לתמונה באמצעות למידה עמוקה (Deep Learning). אתם תלמדו על הרכיבים השונים במודל הוספת כיתוב לתמונה, כמו המקודד והמפענח, ואיך לאמן את המודל ולהעריך את הביצועים שלו. בסוף הקורס תוכלו ליצור מודלים להוספת כיתוב לתמונה ולהשתמש בהם כדי ליצור כיתובים לתמונות
בקורס נלמד על מודלים של דיפוזיה, משפחת מודלים של למידת מכונה שיצרו הרבה ציפיות לאחרונה בתחום של יצירת תמונות. מודלים של דיפוזיה שואבים השראה מפיזיקה, וספציפית מתרמודינמיקה. בשנים האחרונות, מודלים של דיפוזיה הפכו לפופולריים גם בתחום המחקר וגם בתעשייה. מודלים של דיפוזיה עומדים מאחורי הרבה מהכלים והמודלים החדשניים ליצירת תמונות ב-Google Cloud. בקורס הזה נלמד על התיאוריה שמאחורי מודלים של דיפוזיה, ואיך לאמן ולפרוס אותם ב-Vertex AI.
בקורס הזה נציג את הארכיטקטורה של טרנספורמרים ואת המודל של ייצוגים דו-כיווניים של מקודד מטרנספורמרים (BERT). תלמדו על החלקים השונים בארכיטקטורת הטרנספורמר, כמו מנגנון תשומת הלב, ועל התפקיד שלו בבניית מודל BERT. תלמדו גם על המשימות השונות שאפשר להשתמש ב-BERT כדי לבצע אותן, כמו סיווג טקסטים, מענה על שאלות והֶקֵּשׁ משפה טבעית. נדרשות כ-45 דקות כדי להשלים את הקורס הזה.
בקורס נלמד על מנגנון תשומת הלב, שיטה טובה מאוד שמאפשרת לרשתות נוירונים להתמקד בחלקים ספציפיים ברצף הקלט. נלמד איך עובד העיקרון של תשומת הלב, ואיך אפשר להשתמש בו כדי לשפר את הביצועים במגוון משימות של למידת מכונה, כולל תרגום אוטומטי, סיכום טקסט ומענה לשאלות.
זהו קורס מבוא ממוקד שבוחן מהם מודלים גדולים של שפה (LLM), איך משתמשים בהם בתרחישים שונים לדוגמה ואיך אפשר לשפר את הביצועים שלהם באמצעות כוונון של הנחיות. הוא גם כולל הסבר על הכלים של Google שיעזרו לכם לפתח אפליקציות בינה מלאכותית גנרטיבית משלכם.
זהו קורס מבוא ממוקד שמטרתו להסביר מהי בינה מלאכותית גנרטיבית, איך משתמשים בה ובמה היא שונה משיטות מסורתיות של למידת מכונה. הוא גם כולל הסבר על הכלים של Google שיעזרו לכם לפתח אפליקציות בינה מלאכותית גנרטיבית משלכם.