在本课程中,您将全面了解 Google Cloud 提供的存储解决方案,这些解决方案专为 AI 和高性能计算 (HPC) 工作负载量身定制。您将学习如何为机器学习生命周期的各个阶段选择合适的存储选项。您将探索如何在训练期间优化 I/O 性能,管理海量数据集以进行数据准备,以及以低延迟部署模型制品。通过实际案例和演示,您将获得设计可靠存储解决方案所需的专业知识,从而加速 AI 创新。
This course provides a comprehensive guide to deploying, managing, and optimizing AI and high-performance computing (HPC) workloads on Google Cloud. Through a series of lessons and practical demonstrations, you’ll explore diverse deployment strategies, ranging from highly customizable environments using Google Compute Engine (GCE) to managed solutions like Google Kubernetes Engine (GKE). Specifically, you’ll learn how to create clusters and deploy GKE for inference.
欢迎学习 Cloud TPU 课程。我们将探讨 TPU 在不同场景下的优势和劣势,并比较不同的 TPU 加速器,以帮助您选择合适的加速器。您将了解可通过哪些策略充分提高 AI 模型的性能和效率,并理解 GPU/TPU 互操作性对于创建灵活的机器学习工作流程的重要性。通过引人入胜的课程内容和实际演示,您将逐步了解如何有效利用 TPU。
对 AI 背后的强大硬件感到好奇吗?本单元将详细讲解性能经过优化的 AI 计算机,向您展示它们为何如此重要。我们将探讨 CPU、GPU 和 TPU 如何让 AI 任务高速运行,介绍它们各自的特点,并说明 AI 软件是如何充分发挥这些硬件的性能的。学习结束后,您将清楚地知道如何为自己的 AI 项目选择合适的 GPU,从而为 AI 工作负载做出明智的决策。
准备好探索 AI Hypercomputer 了吗?这门课程将带您轻松入门!我们将介绍相关基础知识,并阐释它们如何助力 AI 处理 AI 工作负载。您将了解超级计算机内部的各个组件,如 GPU、TPU 和 CPU,并知晓如何根据您的需求选择合适的部署方法。