Déployer et adapter des modèles d'IA avec Cloud Run
L'inférence de l'IA est le processus qui consiste à utiliser un modèle de machine learning entraîné pour faire des prédictions sur des données nouvelles et inédites en appliquant des schémas appris. Ce cours s'adresse aux développeurs, data scientists et ingénieurs en ML qui souhaitent déployer rapidement des services d'inférence de l'IA sur Cloud Run. Il est utile pour les personnes habituées à utiliser des solutions de déploiement d'applications sans serveur dans le cloud, mais qui manquent d'expérience dans l'exécution de l'inférence de l'IA avec les produits sans serveur Google Cloud.
Il comprend des exemples de déploiement d'un modèle d'inférence de l'IA avec des GPU et d'intégration d'applications d'IA générative avec des services de stockage de données.