Accédez à plus de 700 ateliers et cours

Créer des divisions reproductibles d'ensembles de données dans BigQuery v1.5

Atelier 1 heure 30 minutes universal_currency_alt 5 crédits show_chart Débutant
info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.
Accédez à plus de 700 ateliers et cours

Présentation

Durée : 1 minute

La reproductibilité est importante en machine learning, car l'expérimentation peut devenir compliquée si vous obtenez des réponses différentes pour une même action effectuée à cinq minutes d'intervalle. En d'autres termes, vous aurez du mal à déterminer si votre modification a permis d'améliorer les choses ou non.

Prérequis

  • Vous devez être connecté à la console GCP avec votre compte généré par Qwiklabs.

Objectifs de l'atelier

Dans cet atelier, vous allez découvrir :

  • l'impact des différentes manières de créer des ensembles de données de machine learning.

Avant de commencer l'atelier

Pour chaque atelier, nous vous attribuons un nouveau projet Google Cloud et un nouvel ensemble de ressources pour une durée déterminée, sans frais.

  1. Connectez-vous à Qwiklabs dans une fenêtre de navigation privée.

  2. Vérifiez le temps imparti pour l'atelier (par exemple : 01:15:00) : vous devez pouvoir le terminer dans ce délai.
    Une fois l'atelier lancé, vous ne pouvez pas le mettre en pause. Si nécessaire, vous pourrez le redémarrer, mais vous devrez tout reprendre depuis le début.

  3. Lorsque vous êtes prêt, cliquez sur Démarrer l'atelier.

  4. Notez vos identifiants pour l'atelier (Nom d'utilisateur et Mot de passe). Ils vous serviront à vous connecter à Google Cloud Console.

  5. Cliquez sur Ouvrir la console Google.

  6. Cliquez sur Utiliser un autre compte, puis copiez-collez les identifiants de cet atelier lorsque vous y êtes invité.
    Si vous utilisez d'autres identifiants, des messages d'erreur s'afficheront ou des frais seront appliqués.

  7. Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.

Tâche 1 : Lancer une instance de notebook Vertex AI

  1. Cliquez sur le menu de navigation.

  2. Cliquez sur Vertex AI > Tableau de bord.

  3. Cliquez sur Activer toutes les API recommandées. Cette action ne prend que quelques secondes.

  4. Cliquez sur Workbench dans le volet de gauche.

  5. Cliquez sur Notebooks gérés par l'utilisateur dans le ruban Vue.

  6. Cliquez sur l'icône + Créer en haut de la page.

  7. Sous Environnement, sélectionnez Python 3 (avec Intel® MKL).

  8. Cliquez sur le lien Options avancées en bas de la fenêtre latérale.

  9. Définissez la région sur et la zone sur .

  10. Cliquez sur Type de machine dans le volet de gauche. Sélectionnez E2-standard et e2-standard-4 dans la liste d'options.

  11. Au bas de la page, cliquez sur Créer. La création du notebook prend normalement 4 à 7 minutes.

  12. Après quelques minutes, la console Vertex AI affiche le nom de votre instance, suivi de Open Jupyterlab (Ouvrir JupyterLab). Cliquez sur Open Jupyterlab (Ouvrir JupyterLab).

Votre environnement de notebook est maintenant configuré.

Tâche 2 : Cloner le dépôt du cours dans votre instance de notebook AI Platform

Pour cloner le notebook "training-data-analyst" dans votre instance JupyterLab :

  1. Dans JupyterLab, cliquez sur l'icône Terminal pour ouvrir un nouveau terminal.

  2. À l'invite, exécutez la commande suivante :

    git clone https://github.com/GoogleCloudPlatform/training-data-analyst
  3. Pour vérifier que vous avez bien cloné le dépôt, double-cliquez sur le répertoire "training-data-analyst" et vérifiez que vous pouvez voir son contenu.
    Vous y trouverez les fichiers de tous les ateliers de ce cours basés sur des notebooks Jupyter.

Tâche 3 : Créer des divisions reproductibles d'ensembles de données

Durée : 15 minutes

  1. Dans l'interface du notebook, accédez à training-data-analyst > courses > machine_learning > deepdive > 02_generalization et ouvrez repeatable_splitting.ipynb.

  2. Dans l'interface du notebook, cliquez sur Edit > Clear All Outputs (Modifier > Supprimer tous les éléments de sortie).

  3. Lisez ensuite les explications et exécutez chaque cellule à tour de rôle.

Terminer l'atelier

Une fois l'atelier terminé, cliquez sur Terminer l'atelier. Google Cloud Skills Boost supprime les ressources que vous avez utilisées, puis efface le compte.

Si vous le souhaitez, vous pouvez noter l'atelier. Sélectionnez un nombre d'étoiles, saisissez un commentaire, puis cliquez sur Envoyer.

Le nombre d'étoiles correspond à votre degré de satisfaction :

  • 1 étoile = très insatisfait(e)
  • 2 étoiles = insatisfait(e)
  • 3 étoiles = ni insatisfait(e), ni satisfait(e)
  • 4 étoiles = satisfait(e)
  • 5 étoiles = très satisfait(e)

Si vous ne souhaitez pas donner votre avis, vous pouvez fermer la boîte de dialogue.

Pour soumettre des commentaires, suggestions ou corrections, veuillez accéder à l'onglet Assistance.

Copyright 2020 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.

Avant de commencer

  1. Les ateliers créent un projet Google Cloud et des ressources pour une durée déterminée.
  2. Les ateliers doivent être effectués dans le délai imparti et ne peuvent pas être mis en pause. Si vous quittez l'atelier, vous devrez le recommencer depuis le début.
  3. En haut à gauche de l'écran, cliquez sur Démarrer l'atelier pour commencer.

Utilisez la navigation privée

  1. Copiez le nom d'utilisateur et le mot de passe fournis pour l'atelier
  2. Cliquez sur Ouvrir la console en navigation privée

Connectez-vous à la console

  1. Connectez-vous à l'aide des identifiants qui vous ont été attribués pour l'atelier. L'utilisation d'autres identifiants peut entraîner des erreurs ou des frais.
  2. Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
  3. Ne cliquez pas sur Terminer l'atelier, à moins que vous n'ayez terminé l'atelier ou que vous ne vouliez le recommencer, car cela effacera votre travail et supprimera le projet.

Ce contenu n'est pas disponible pour le moment

Nous vous préviendrons par e-mail lorsqu'il sera disponible

Parfait !

Nous vous contacterons par e-mail s'il devient disponible

Un atelier à la fois

Confirmez pour mettre fin à tous les ateliers existants et démarrer celui-ci

Utilisez la navigation privée pour effectuer l'atelier

Ouvrez une fenêtre de navigateur en mode navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.