Nick Nöthling
Date d'abonnement : 2025
Date d'abonnement : 2025
Complete the advanced Google DeepMind: Train A Small Language Model skill badge by completing this course to demonstrate skills in the following: formulating real-world language model research problems; building a simple tokenizer; preparing a dataset for training a transformer language model; running the training loop of a small language model. Access this lab at no-cost by signing up for the no-cost subscription. Receive 35 free credits each month!
Terminez le cours intermédiaire Créer des modèles de ML avec BigQuery ML pour recevoir un badge démontrant vos compétences dans les domaines suivants : la création et l'évaluation de modèles de machine learning avec BigQuery ML pour générer des prédictions de données.
Dans ce cours, vous allez vous exercer à résoudre des problèmes concrets rencontrés lors de la création de pipelines de flux données. L'objectif principal est de gérer des données continues et illimitées avec les produits Google Cloud.
Dans ce cours de niveau intermédiaire, vous apprendrez à concevoir, créer et optimiser des pipelines de données en batch robustes sur Google Cloud. Au-delà des bases de la gestion des données, vous explorerez les transformations de données à grande échelle et l'orchestration efficace des workflows, essentielles pour l'informatique décisionnelle et les rapports critiques. Vous vous entraînerez à utiliser Dataflow pour Apache Beam et Serverless pour Apache Spark (Dataproc Serverless) pour l'implémentation, et vous aborderez des considérations importantes concernant la qualité des données, la surveillance et les alertes pour assurer la fiabilité des pipelines et l'excellence opérationnelle. Il est recommandé d'avoir des connaissances de base sur l'entreposage de données, les processus ETL/ELT, SQL, Python et les concepts de Google Cloud.
Bien que les approches traditionnelles utilisant des lacs de données et des entrepôts de données puissent être efficaces, elles présentent des inconvénients, en particulier dans les grands environnements d'entreprise. Ce cours présente le concept de data lakehouse et les produits Google Cloud utilisés pour en créer un. Une architecture de lakehouse utilise des sources de données basées sur des normes ouvertes et combine les meilleures fonctionnalités des lacs et des entrepôts de données, ce qui permet de pallier de nombreuses lacunes.
Dans ce cours, vous allez explorer l'ingénierie de données sur Google Cloud, les rôles et responsabilités des ingénieurs de données, et la façon dont ces éléments se retrouvent dans les offres Google Cloud. Vous apprendrez également à relever les défis liés à l'ingénierie de données.
Ce cours a pour objectif d'aider les participants à créer un plan de formation pour l'examen de certification Professional Data Engineer. Les participants découvriront l'étendue et le champ d'application des domaines abordés lors de l'examen, puis évalueront leur niveau de préparation à l'examen et créeront leur propre plan de formation.
Découvrez BigQuery ML pour l'inférence, pourquoi les analystes de données devraient s'en servir, ses cas d'utilisation et les modèles de ML compatibles. Apprenez également à créer des modèles de ML et à les gérer dans BigQuery.
Dans ce cours, vous découvrirez comment Gemini, un outil de collaboration Google Cloud optimisé par l'IA générative, aide à analyser les données client et à prédire les ventes de produits. Vous apprendrez également à identifier, classer et développer de nouveaux clients à l'aide des données client dans BigQuery. À l'aide d'ateliers pratiques, vous verrez en quoi Gemini améliore les workflows d'analyse de données et de machine learning. Duet AI a été rebaptisé Gemini, notre modèle nouvelle génération.
This video covers how to use Gemini and Apps Script to automate manual tasks across Google Workspace. You'll learn to prompt Gemini to generate Apps Script code that automatically drafts email reminders in Google Sheets for tasks not marked 'Complete.' Automate your workflow with little to no technical expertise, freeing up time for more important work and eliminating manual follow-ups.
Ce cours présente le concept d'IA responsable et les principes associés. Il met en avant des techniques permettant d'identifier des données équitables ou biaisées, et de limiter les biais lors de l'utilisation de l'IA/du ML. Vous découvrirez des méthodes pratiques et des outils pour mettre en place de bonnes pratiques d'IA responsable à l'aide des produits Google Cloud et des outils Open Source.
Dans ce cours, vous allez apprendre à créer un modèle de sous-titrage d'images à l'aide du deep learning. Vous découvrirez les différents composants de ce type de modèle, comme l'encodeur et le décodeur, et comment l'entraîner et l'évaluer. À la fin du cours, vous serez en mesure de créer vos propres modèles de sous-titrage d'images et de les utiliser pour générer des sous-titres pour des images.
Ce cours présente l'architecture Transformer et le modèle BERT (Bidirectional Encoder Representations from Transformers). Vous découvrirez quels sont les principaux composants de l'architecture Transformer, tels que le mécanisme d'auto-attention, et comment ils sont utilisés pour créer un modèle BERT. Vous verrez également les différentes tâches pour lesquelles le modèle BERT peut être utilisé, comme la classification de texte, les questions-réponses et l'inférence en langage naturel. Ce cours dure environ 45 minutes.
Ce cours offre un aperçu de l'architecture encodeur/décodeur, une architecture de machine learning performante souvent utilisée pour les tâches "seq2seq", telles que la traduction automatique, la synthèse de texte et les questions-réponses. Vous découvrirez quels sont les principaux composants de l'architecture encodeur/décodeur, et comment entraîner et exécuter ces modèles. Dans le tutoriel d'atelier correspondant, vous utiliserez TensorFlow pour coder une implémentation simple de cette architecture afin de générer un poème en partant de zéro.
Ce cours présente le mécanisme d'attention, une technique efficace permettant aux réseaux de neurones de se concentrer sur des parties spécifiques d'une séquence d'entrée. Vous découvrirez comment fonctionne l'attention et comment l'utiliser pour améliorer les performances de diverses tâches de machine learning, dont la traduction automatique, la synthèse de texte et les réponses aux questions.
Ce cours présente Gemini dans BigQuery, une suite de fonctionnalités basées sur l'IA conçue pour faciliter le workflow "des données à l'IA". Ces fonctionnalités incluent l'exploration et la préparation des données, la génération et le dépannage de code, ainsi que la découverte et la visualisation du workflow. Au moyen d'explications conceptuelles, d'un cas d'utilisation concret et d'ateliers pratiques, le cours explique aux professionnels des données comment booster leur productivité et accélérer le pipeline de développement.
Ce cours montre comment utiliser des modèles d'IA/de ML pour des tâches d'IA générative dans BigQuery. À travers un cas d'utilisation pratique faisant intervenir la gestion de la relation client, vous étudierez le workflow de résolution d'un problème métier à l'aide de modèles Gemini. Pour faciliter la compréhension, le cours fournit également des instructions détaillées tout au long du codage des solutions à l'aide de requêtes SQL et de Notebooks Python.
Terminez le cours intermédiaire Implémenter la recherche vectorielle multimodale avec BigQuery pour recevoir un badge démontrant vos compétences dans les domaines suivants : utiliser Gemini dans BigQuery pour générer et déboguer des requêtes SQL, effectuer une analyse des sentiments, résumer du texte et identifier des mots clés, générer des embeddings, créer un pipeline de RAG (génération augmentée par récupération), et implémenter la recherche vectorielle multimodale.
Ce cours présente une solution de génération augmentée par récupération (RAG) dans BigQuery permettant de réduire les hallucinations de l'IA. Il décrit un workflow RAG qui couvre la création d'embeddings, la recherche dans un espace vectoriel et la génération de réponses améliorées. Il explique aussi les raisons conceptuelles derrière ces étapes et leur implémentation pratique avec BigQuery. À la fin du cours, les participants seront à même de créer un pipeline de RAG à l'aide de BigQuery et de modèles d'IA générative tels que Gemini, ainsi que des modèles d'embeddings pour traiter leurs propres cas d'hallucinations de l'IA.
Ce cours présente les modèles de diffusion, une famille de modèles de machine learning qui s'est récemment révélée prometteuse dans le domaine de la génération d'images. Les modèles de diffusion trouvent leur origine dans la physique, et plus précisément dans la thermodynamique. Au cours des dernières années, ils ont gagné en popularité dans la recherche et l'industrie. Ils sont à la base de nombreux modèles et outils Google Cloud avancés de génération d'images. Ce cours vous présente les bases théoriques des modèles de diffusion, et vous explique comment les entraîner et les déployer sur Vertex AI.
Avec ce cours, explorez les technologies de recherche, les outils et les applications optimisés par l'IA. Découvrez la recherche sémantique, qui utilise les embeddings vectoriels (ou "plongements vectoriels"), la recherche hybride, qui combine les approches sémantique et par mots-clés, et la génération augmentée par récupération (RAG), qui réduit les hallucinations générées par l'IA en agissant comme un agent ancré. Enfin, acquérez une expérience pratique de Vertex AI Vector Search afin de créer votre moteur de recherche intelligent.
Validez le cours intermédiaire Améliorer les capacités du modèle Gemini pour recevoir un badge attestant de vos compétences dans les domaines suivants : utiliser les fonctionnalités avancées des modèles Gemini, y compris la génération et l'exécution de code, l'ancrage, la génération de contenu contrôlée, et la création de données synthétiques, afin de développer des applications d'IA plus puissantes et sophistiquées.
Terminez le cours intermédiaire Inspecter des documents enrichis avec Gemini multimodal et le RAG multimodal pour recevoir un badge démontrant vos compétences dans les domaines suivants : l'utilisation de requêtes multimodales pour extraire des informations de données textuelles et visuelles, la génération d'une description vidéo et la récupération d'informations qui ne sont pas incluses dans une vidéo en utilisant la multimodalité avec Gemini ; la création de métadonnées de documents contenant du texte et des images, la collecte de tous les éléments de texte pertinents, et l'impression de citations à l'aide de la génération augmentée par récupération (RAG, Retrieval Augmented Generation) multimodale avec Gemini.
Ce cours apporte aux professionnels du machine learning les techniques, les bonnes pratiques et les outils essentiels pour évaluer les modèles d'IA prédictive et générative. L'évaluation des modèles est primordiale pour s'assurer que les systèmes de ML fournissent des résultats fiables, précis et de haut niveau en production. Les participants acquerront une connaissance approfondie de diverses métriques et méthodologies d'évaluation, ainsi que de leur application appropriée dans différents types de modèles et tâches. Le cours mettra l'accent sur les défis uniques posés par les modèles d'IA générative et proposera des stratégies pour les relever efficacement. Grâce à la plate-forme Vertex AI de Google Cloud, les participants apprendront à implémenter des processus d'évaluation rigoureux pour la sélection, l'optimisation et la surveillance continue des modèles.
Dans ce cours, vous allez acquérir les connaissances et les outils nécessaires pour identifier les problématiques uniques auxquelles les équipes MLOps sont confrontées lors du déploiement et de la gestion de modèles d'IA générative. Vous verrez également en quoi Vertex AI permet aux équipes d'IA de simplifier les processus MLOps et de faire aboutir leurs projets d'IA générative.