Instructions et exigences de configuration de l'atelier
Protégez votre compte et votre progression. Utilisez toujours une fenêtre de navigation privée et les identifiants de l'atelier pour exécuter cet atelier.

Charger des données dans BigQuery

Atelier 1 heure 30 minutes universal_currency_alt 5 crédits show_chart Débutant
info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.
Ce contenu n'est pas encore optimisé pour les appareils mobiles.
Pour une expérience optimale, veuillez accéder à notre site sur un ordinateur de bureau en utilisant un lien envoyé par e-mail.

Présentation

BigQuery est la base de données d'analyse NoOps, économique et entièrement gérée de Google. Avec BigQuery, vous pouvez interroger plusieurs téraoctets de données sans avoir à gérer d'infrastructure ni faire appel à un administrateur de base de données. Basé sur le langage SQL et le modèle de paiement à l'usage, BigQuery vous permet de vous concentrer sur l'analyse des données pour en dégager des insights pertinents.

Dans cet atelier, vous allez ingérer des sous-ensembles de données sur les courses de taxi à New York dans des tables BigQuery.

Points abordés

  • Chargement de données issues de sources diverses dans BigQuery
  • Chargement de données dans BigQuery à l'aide de la CLI et de la console
  • Création de tables à l'aide du LDD

Préparation

Pour chaque atelier, nous vous attribuons un nouveau projet Google Cloud et un nouvel ensemble de ressources pour une durée déterminée, sans frais.

  1. Connectez-vous à Qwiklabs dans une fenêtre de navigation privée.

  2. Vérifiez le temps imparti pour l'atelier (par exemple : 01:15:00) : vous devez pouvoir le terminer dans ce délai.
    Une fois l'atelier lancé, vous ne pouvez pas le mettre en pause. Si nécessaire, vous pourrez le redémarrer, mais vous devrez tout reprendre depuis le début.

  3. Lorsque vous êtes prêt, cliquez sur Démarrer l'atelier.

  4. Notez vos identifiants pour l'atelier (Nom d'utilisateur et Mot de passe). Ils vous serviront à vous connecter à Google Cloud Console.

  5. Cliquez sur Ouvrir la console Google.

  6. Cliquez sur Utiliser un autre compte, puis copiez-collez les identifiants de cet atelier lorsque vous y êtes invité.
    Si vous utilisez d'autres identifiants, des messages d'erreur s'afficheront ou des frais seront appliqués.

  7. Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.

Ouvrir la console BigQuery

  1. Dans la console Google Cloud, sélectionnez le menu de navigation > BigQuery.

Le message Bienvenue sur BigQuery dans la console Cloud s'affiche. Il contient un lien vers le guide de démarrage rapide et liste les mises à jour de l'interface utilisateur.

  1. Cliquez sur Done (OK).

Tâche 1 : Créer un ensemble de données pour stocker les tables

  1. Pour créer un ensemble de données, cliquez sur l'icône Afficher les actions (les trois points verticaux) située à côté de l'ID de votre projet, puis sélectionnez Créer un ensemble de données.

  2. Ensuite, saisissez nyctaxi pour l'ID de l'ensemble de données et conservez la valeur par défaut de toutes les autres options. Enfin, cliquez sur Créer l'ensemble de données.

L'ensemble de données "nyctaxi" s'affiche à présent sous le nom de votre projet.

Cliquez sur Vérifier ma progression pour valider l'objectif. Créer un ensemble de données pour stocker les nouvelles tables

Tâche 2 : Ingérer un nouvel ensemble de données à partir d'un fichier CSV

Dans cette section, vous allez charger un fichier CSV local dans une table BigQuery.

  1. Téléchargez un sous-ensemble de données concernant les courses de taxi à New York en 2018 sur votre ordinateur en cliquant sur ce lien.

  2. Dans la console BigQuery, sélectionnez l'ensemble de données nyctaxi, puis cliquez sur Créer une table

Spécifiez les options de table suivantes :

Source :

  • Créer une table à partir de : Importer
  • Sélectionner un fichier : sélectionnez le fichier que vous avez téléchargé précédemment
  • Format de fichier : CSV

Destination :

  • Nom de la table : 2018trips Conservez les valeurs par défaut des autres paramètres.

Schéma :

  • Cochez la case Détection automatique (Remarque : si vous ne voyez pas la case à cocher, vérifiez que le fichier est bien au format CSV et non Avro.)

Options avancées

  • Conservez les valeurs par défaut

Cliquez sur Créer une table.

  1. La table 2018trips doit s'afficher sous l'ensemble de données "nyctaxi".

Sélectionnez la table "2018trips", et affichez les détails :

  1. Sélectionnez Aperçu et vérifiez que toutes les colonnes ont été chargées (voir échantillon ci-dessous) :

Vous venez de charger un fichier CSV dans une nouvelle table BigQuery.

Exécuter des requêtes SQL

Maintenant, entraînez-vous avec une requête de base sur la table "2018trips".

  1. Dans l'éditeur de requête, écrivez une requête pour lister les cinq courses les plus coûteuses de l'année :
#standardSQL SELECT * FROM nyctaxi.2018trips ORDER BY fare_amount DESC LIMIT 5

Cliquez sur Vérifier ma progression pour valider l'objectif. Ingérer un nouvel ensemble de données à partir d'un fichier CSV

Tâche 3 : Ingérer un nouvel ensemble de données à partir de Google Cloud Storage

Maintenant, vous allez essayer de charger un autre sous-ensemble de données à partir de l'ensemble de données sur les courses en 2018 disponible sur Cloud Storage. Pour cela, vous allez utiliser l'outil de CLI.

  1. Dans Cloud Shell, exécutez la commande suivante :
bq load \ --source_format=CSV \ --autodetect \ --noreplace \ nyctaxi.2018trips \ gs://cloud-training/OCBL013/nyc_tlc_yellow_trips_2018_subset_2.csv Remarque : Dans le job de chargement ci-dessus, vous indiquez que ce sous-ensemble doit être ajouté à la table "2018trips" créée plus haut.
  1. Une fois le chargement terminé, une confirmation s'affiche à l'écran.

  2. De retour dans la console BigQuery, sélectionnez la table "2018trips", et affichez les détails. Vérifiez le nombre de lignes : il devrait avoir presque doublé.

  3. Si vous le souhaitez, vous pouvez exécuter la requête précédente afin de voir si les cinq courses les plus coûteuses ont changé.

Cliquez sur Vérifier ma progression pour valider l'objectif. Ingérer un ensemble de données à partir de Google Cloud Storage

Tâche 4 : Créer des tables à partir d'autres tables avec le LDD

La table "2018trips" contient maintenant des courses de toute l'année. Imaginons que seules les courses de janvier vous intéressent. Pour les besoins de cet atelier, nous allons privilégier la simplicité, et nous en tenir à la date et à l'heure de la prise en charge. Utilisez le LDD pour extraire ces données et les stocker dans une autre table.

  1. Dans l'éditeur de requête, exécutez la commande CREATE TABLE suivante :
#standardSQL CREATE TABLE nyctaxi.january_trips AS SELECT * FROM nyctaxi.2018trips WHERE EXTRACT(Month FROM pickup_datetime)=1;
  1. Dans l'éditeur de requête, exécutez maintenant la requête ci-dessous pour trouver la plus longue distance parcourue au mois de janvier :
#standardSQL SELECT * FROM nyctaxi.january_trips ORDER BY trip_distance DESC LIMIT 1

Cliquez sur Vérifier ma progression pour valider l'objectif. Créer des tables à partir d'autres tables avec le LDD

Félicitations !

Vous avez créé un ensemble de données et ingéré des données dans BigQuery à partir d'un fichier CSV, de Google Cloud Storage et d'autres tables BigQuery.

Terminer l'atelier

Une fois l'atelier terminé, cliquez sur Terminer l'atelier. Google Cloud Skills Boost supprime les ressources que vous avez utilisées, puis efface le compte.

Si vous le souhaitez, vous pouvez noter l'atelier. Sélectionnez un nombre d'étoiles, saisissez un commentaire, puis cliquez sur Envoyer.

Le nombre d'étoiles correspond à votre degré de satisfaction :

  • 1 étoile = très insatisfait(e)
  • 2 étoiles = insatisfait(e)
  • 3 étoiles = ni insatisfait(e), ni satisfait(e)
  • 4 étoiles = satisfait(e)
  • 5 étoiles = très satisfait(e)

Si vous ne souhaitez pas donner votre avis, vous pouvez fermer la boîte de dialogue.

Pour soumettre des commentaires, suggestions ou corrections, veuillez accéder à l'onglet Assistance.

Dernière mise à jour du manuel : 27 juillet 2022

Dernier test de l'atelier : 15 juillet 2022

Copyright 2026 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms de société et de produit peuvent être des marques des sociétés auxquelles ils sont associés.

Avant de commencer

  1. Les ateliers créent un projet Google Cloud et des ressources pour une durée déterminée.
  2. Les ateliers doivent être effectués dans le délai imparti et ne peuvent pas être mis en pause. Si vous quittez l'atelier, vous devrez le recommencer depuis le début.
  3. En haut à gauche de l'écran, cliquez sur Démarrer l'atelier pour commencer.

Utilisez la navigation privée

  1. Copiez le nom d'utilisateur et le mot de passe fournis pour l'atelier
  2. Cliquez sur Ouvrir la console en navigation privée

Connectez-vous à la console

  1. Connectez-vous à l'aide des identifiants qui vous ont été attribués pour l'atelier. L'utilisation d'autres identifiants peut entraîner des erreurs ou des frais.
  2. Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
  3. Ne cliquez pas sur Terminer l'atelier, à moins que vous n'ayez terminé l'atelier ou que vous ne vouliez le recommencer, car cela effacera votre travail et supprimera le projet.

Ce contenu n'est pas disponible pour le moment

Nous vous préviendrons par e-mail lorsqu'il sera disponible

Parfait !

Nous vous contacterons par e-mail s'il devient disponible

Un atelier à la fois

Confirmez pour mettre fin à tous les ateliers existants et démarrer celui-ci

Utilisez la navigation privée pour effectuer l'atelier

Le meilleur moyen d'exécuter cet atelier consiste à utiliser une fenêtre de navigation privée. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.