Ce cours constitue un guide complet pour déployer, gérer et optimiser des charges de travail d'IA et de calcul hautes performances (HPC) sur Google Cloud. À travers une série de leçons et de démonstrations pratiques, vous explorerez diverses stratégies de déploiement, allant d'environnements hautement personnalisables utilisant Google Compute Engine (GCE) à des solutions gérées comme Google Kubernetes Engine (GKE). Plus précisément, vous apprendrez à créer des clusters et à déployer GKE pour l'inférence.
Dans ce cours, vous allez acquérir les connaissances et les outils nécessaires pour identifier les problématiques uniques auxquelles les équipes MLOps sont confrontées lors du déploiement et de la gestion de modèles d'IA générative. Vous verrez également en quoi Vertex AI permet aux équipes d'IA de simplifier les processus MLOps et de faire aboutir leurs projets d'IA générative.