Mettez en pratique vos compétences dans la console Google Cloud
Points de contrôle
Creating a dataset to store new tables
Vérifier ma progression
/ 10
Ingest a new Dataset from a CSV
Vérifier ma progression
/ 10
Ingest a dataset from google cloud storage
Vérifier ma progression
/ 10
Create tables from other tables with DDL
Vérifier ma progression
/ 10
Instructions et exigences de configuration de l'atelier
Protégez votre compte et votre progression. Utilisez toujours une fenêtre de navigation privée et les identifiants de l'atelier pour exécuter cet atelier.
Ce contenu n'est pas encore optimisé pour les appareils mobiles.
Pour une expérience optimale, veuillez accéder à notre site sur un ordinateur de bureau en utilisant un lien envoyé par e-mail.
Présentation
BigQuery est la base de données d'analyse NoOps, économique et entièrement gérée de Google. Avec BigQuery, vous pouvez interroger plusieurs téraoctets de données sans avoir à gérer d'infrastructure ni faire appel à un administrateur de base de données. Basé sur le langage SQL et le modèle de paiement à l'usage, BigQuery vous permet de vous concentrer sur l'analyse des données pour en dégager des insights pertinents.
Dans cet atelier, vous allez ingérer des sous-ensembles de données sur les courses de taxi à New York dans des tables BigQuery.
Points abordés
Chargement de données issues de sources diverses dans BigQuery
Chargement de données dans BigQuery à l'aide de la CLI et de la console
Création de tables à l'aide du LDD
Préparation
Pour chaque atelier, nous vous attribuons un nouveau projet Google Cloud et un nouvel ensemble de ressources pour une durée déterminée, sans frais.
Connectez-vous à Qwiklabs dans une fenêtre de navigation privée.
Vérifiez le temps imparti pour l'atelier (par exemple : 01:15:00) : vous devez pouvoir le terminer dans ce délai.
Une fois l'atelier lancé, vous ne pouvez pas le mettre en pause. Si nécessaire, vous pourrez le redémarrer, mais vous devrez tout reprendre depuis le début.
Lorsque vous êtes prêt, cliquez sur Démarrer l'atelier.
Notez vos identifiants pour l'atelier (Nom d'utilisateur et Mot de passe). Ils vous serviront à vous connecter à Google Cloud Console.
Cliquez sur Ouvrir la console Google.
Cliquez sur Utiliser un autre compte, puis copiez-collez les identifiants de cet atelier lorsque vous y êtes invité.
Si vous utilisez d'autres identifiants, des messages d'erreur s'afficheront ou des frais seront appliqués.
Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
Ouvrir la console BigQuery
Dans la console Google Cloud, sélectionnez le menu de navigation > BigQuery.
Le message Bienvenue sur BigQuery dans la console Cloud s'affiche. Il contient un lien vers le guide de démarrage rapide et liste les mises à jour de l'interface utilisateur.
Cliquez sur Done (OK).
Tâche 1 : Créer un ensemble de données pour stocker les tables
Pour créer un ensemble de données, cliquez sur l'icône Afficher les actions (les trois points verticaux) située à côté de l'ID de votre projet, puis sélectionnez Créer un ensemble de données.
Ensuite, saisissez nyctaxi pour l'ID de l'ensemble de données et conservez la valeur par défaut de toutes les autres options. Enfin, cliquez sur Créer l'ensemble de données.
L'ensemble de données "nyctaxi" s'affiche à présent sous le nom de votre projet.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Créer un ensemble de données pour stocker les nouvelles tables
Tâche 2 : Ingérer un nouvel ensemble de données à partir d'un fichier CSV
Dans cette section, vous allez charger un fichier CSV local dans une table BigQuery.
Téléchargez un sous-ensemble de données concernant les courses de taxi à New York en 2018 sur votre ordinateur en cliquant sur ce lien.
Dans la console BigQuery, sélectionnez l'ensemble de données nyctaxi, puis cliquez sur Créer une table
Spécifiez les options de table suivantes :
Source :
Créer une table à partir de : Importer
Sélectionner un fichier : sélectionnez le fichier que vous avez téléchargé précédemment
Format de fichier : CSV
Destination :
Nom de la table : 2018trips
Conservez les valeurs par défaut des autres paramètres.
Schéma :
Cochez la case Détection automatique (Remarque : si vous ne voyez pas la case à cocher, vérifiez que le fichier est bien au format CSV et non Avro.)
Options avancées
Conservez les valeurs par défaut
Cliquez sur Créer une table.
La table 2018trips doit s'afficher sous l'ensemble de données "nyctaxi".
Sélectionnez la table "2018trips", et affichez les détails :
Sélectionnez Aperçu et vérifiez que toutes les colonnes ont été chargées (voir échantillon ci-dessous) :
Vous venez de charger un fichier CSV dans une nouvelle table BigQuery.
Exécuter des requêtes SQL
Maintenant, entraînez-vous avec une requête de base sur la table "2018trips".
Dans l'éditeur de requête, écrivez une requête pour lister les cinq courses les plus coûteuses de l'année :
#standardSQL
SELECT
*
FROM
nyctaxi.2018trips
ORDER BY
fare_amount DESC
LIMIT 5
Cliquez sur Vérifier ma progression pour valider l'objectif.
Ingérer un nouvel ensemble de données à partir d'un fichier CSV
Tâche 3 : Ingérer un nouvel ensemble de données à partir de Google Cloud Storage
Maintenant, vous allez essayer de charger un autre sous-ensemble de données à partir de l'ensemble de données sur les courses en 2018 disponible sur Cloud Storage. Pour cela, vous allez utiliser l'outil de CLI.
Dans Cloud Shell, exécutez la commande suivante :
bq load \
--source_format=CSV \
--autodetect \
--noreplace \
nyctaxi.2018trips \
gs://cloud-training/OCBL013/nyc_tlc_yellow_trips_2018_subset_2.csv
Remarque : Dans le job de chargement ci-dessus, vous indiquez que ce sous-ensemble doit être ajouté à la table "2018trips" créée plus haut.
Une fois le chargement terminé, une confirmation s'affiche à l'écran.
De retour dans la console BigQuery, sélectionnez la table "2018trips", et affichez les détails. Vérifiez le nombre de lignes : il devrait avoir presque doublé.
Si vous le souhaitez, vous pouvez exécuter la requête précédente afin de voir si les cinq courses les plus coûteuses ont changé.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Ingérer un ensemble de données à partir de Google Cloud Storage
Tâche 4 : Créer des tables à partir d'autres tables avec le LDD
La table "2018trips" contient maintenant des courses de toute l'année. Imaginons que seules les courses de janvier vous intéressent. Pour les besoins de cet atelier, nous allons privilégier la simplicité, et nous en tenir à la date et à l'heure de la prise en charge. Utilisez le LDD pour extraire ces données et les stocker dans une autre table.
Dans l'éditeur de requête, exécutez la commande CREATE TABLE suivante :
#standardSQL
CREATE TABLE
nyctaxi.january_trips AS
SELECT
*
FROM
nyctaxi.2018trips
WHERE
EXTRACT(Month
FROM
pickup_datetime)=1;
Dans l'éditeur de requête, exécutez maintenant la requête ci-dessous pour trouver la plus longue distance parcourue au mois de janvier :
#standardSQL
SELECT
*
FROM
nyctaxi.january_trips
ORDER BY
trip_distance DESC
LIMIT
1
Cliquez sur Vérifier ma progression pour valider l'objectif.
Créer des tables à partir d'autres tables avec le LDD
Félicitations !
Vous avez créé un ensemble de données et ingéré des données dans BigQuery à partir d'un fichier CSV, de Google Cloud Storage et d'autres tables BigQuery.
Terminer l'atelier
Une fois l'atelier terminé, cliquez sur Terminer l'atelier. Google Cloud Skills Boost supprime les ressources que vous avez utilisées, puis efface le compte.
Si vous le souhaitez, vous pouvez noter l'atelier. Sélectionnez un nombre d'étoiles, saisissez un commentaire, puis cliquez sur Envoyer.
Le nombre d'étoiles correspond à votre degré de satisfaction :
1 étoile = très insatisfait(e)
2 étoiles = insatisfait(e)
3 étoiles = ni insatisfait(e), ni satisfait(e)
4 étoiles = satisfait(e)
5 étoiles = très satisfait(e)
Si vous ne souhaitez pas donner votre avis, vous pouvez fermer la boîte de dialogue.
Pour soumettre des commentaires, suggestions ou corrections, veuillez accéder à l'onglet Assistance.
Dernière mise à jour du manuel : 27 juillet 2022
Dernier test de l'atelier : 15 juillet 2022
Copyright 2026 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms de société et de produit peuvent être des marques des sociétés auxquelles ils sont associés.
Les ateliers créent un projet Google Cloud et des ressources pour une durée déterminée.
Les ateliers doivent être effectués dans le délai imparti et ne peuvent pas être mis en pause. Si vous quittez l'atelier, vous devrez le recommencer depuis le début.
En haut à gauche de l'écran, cliquez sur Démarrer l'atelier pour commencer.
Utilisez la navigation privée
Copiez le nom d'utilisateur et le mot de passe fournis pour l'atelier
Cliquez sur Ouvrir la console en navigation privée
Connectez-vous à la console
Connectez-vous à l'aide des identifiants qui vous ont été attribués pour l'atelier. L'utilisation d'autres identifiants peut entraîner des erreurs ou des frais.
Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
Ne cliquez pas sur Terminer l'atelier, à moins que vous n'ayez terminé l'atelier ou que vous ne vouliez le recommencer, car cela effacera votre travail et supprimera le projet.
Ce contenu n'est pas disponible pour le moment
Nous vous préviendrons par e-mail lorsqu'il sera disponible
Parfait !
Nous vous contacterons par e-mail s'il devient disponible
Un atelier à la fois
Confirmez pour mettre fin à tous les ateliers existants et démarrer celui-ci
Utilisez la navigation privée pour effectuer l'atelier
Le meilleur moyen d'exécuter cet atelier consiste à utiliser une fenêtre de navigation privée. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
Cet atelier explique comment ingérer des données dans des tables BigQuery.
Durée :
0 min de configuration
·
Accessible pendant 90 min
·
Terminé après 90 min