GSP123
Présentation
Managed Service pour Apache Spark est un service Spark et Hadoop géré qui vous permet de bénéficier d'outils de données Open Source pour le traitement par lot, le requêtage, les flux de données et le machine learning. L'automatisation Managed Service pour Apache Spark vous permet de créer des clusters rapidement, de les gérer facilement et de faire des économies en désactivant ceux que vous n'utilisez plus. Vous consacrez moins de temps et d'argent aux fonctions d'administration, ce qui vous permet de vous concentrer sur les jobs et les données.
Cet atelier est une adaptation du guide Créer un cluster Managed Service pour Apache Spark à l'aide de la console Google Cloud.
Points abordés
- Créer un cluster Managed Service pour Apache Spark (avec Apache Spark préinstallé)
- Soumettre un job Spark
- Arrêter votre cluster
Préparation
Avant de cliquer sur le bouton "Démarrer l'atelier"
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
- Vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome).
Remarque : Ouvrez une fenêtre de navigateur en mode incognito (recommandé) ou de navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
- Vous disposez d'un temps limité. N'oubliez pas qu'une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Remarque : Utilisez uniquement le compte de participant pour cet atelier. Si vous utilisez un autre compte Google Cloud, des frais peuvent être facturés à ce compte.
Démarrer l'atelier et se connecter à la console Google Cloud
-
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, une boîte de dialogue s'affiche pour vous permettre de sélectionner un mode de paiement.
Sur la gauche, vous trouverez le panneau "Détails concernant l'atelier", qui contient les éléments suivants :
- Le bouton "Ouvrir la console Google Cloud"
- Le temps restant
- Les identifiants temporaires que vous devez utiliser pour cet atelier
- Des informations complémentaires vous permettant d'effectuer l'atelier
-
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).
L'atelier lance les ressources, puis ouvre la page "Se connecter" dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte.
-
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
{{{user_0.username | "Username"}}}
Vous trouverez également le nom d'utilisateur dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
-
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
{{{user_0.password | "Password"}}}
Vous trouverez également le mot de passe dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
Important : Vous devez utiliser les identifiants fournis pour l'atelier. Ne saisissez pas ceux de votre compte Google Cloud.
Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés.
-
Accédez aux pages suivantes :
- Acceptez les conditions d'utilisation.
- N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
- Ne vous inscrivez pas à des essais sans frais.
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Remarque : Pour accéder aux produits et services Google Cloud, cliquez sur le menu de navigation ou saisissez le nom du service ou du produit dans le champ Recherche.
Attribuer un rôle IAM nécessaire au compte de service Compute Engine
Pour attribuer l'autorisation de stockage au compte de service, qui est requise pour créer un cluster :
-
Dans la console Google Cloud, accédez au menu de navigation (
), puis sélectionnez IAM et administration > IAM.
-
Cliquez sur Modifier le principal (icône en forme de crayon) pour le compte de service Compute Engine par défaut ([numéro-projet]-compute@developer.gserviceaccount.com).
-
Cliquez sur + Ajouter un autre rôle.
-
Dans le champ Sélectionner un rôle, recherchez Administrateur Storage, puis sélectionnez-le dans les résultats.
-
Cliquez sur Enregistrer.
Tâche 1 : Créer un cluster
- Dans la console Google Cloud, accédez au menu de navigation (
), puis cliquez sur Afficher tous les produits. Sous Données analytiques, cliquez sur Managed Apache Spark.

- Pour créer un cluster, cliquez sur Clusters > Créer un cluster.

- Définissez les valeurs des paramètres listés ci-dessous et conservez les paramètres par défaut pour les autres :
| Paramètre |
Valeur |
| Nom |
|
| Région |
|
| Zone |
|
| Développez Configurations avancées > Infrastructure, pour Nœud du gestionnaire > Type de disque principal. |
Disque persistant standard |
| Nœud du gestionnaire : série |
E2 |
| Nœud du gestionnaire : type de machine |
|
| Nœud de gestionnaire : taille du disque principal |
30 Go |
| Nombre de nœuds de calcul |
2 |
| Nœud de calcul : type de disque principal |
Disque persistant standard |
| Nœud de calcul : série |
E2 |
| Nœud de calcul : type de machine |
|
| Nœud de calcul : taille du disque principal |
30 Go |
| Développez Autre > Adresse IP interne uniquement. |
Désélectionnez Configurer toutes les instances pour qu'elles ne possèdent que des adresses IP internes. |
- Cliquez sur Créer pour créer le cluster. L'état passe de "Provisionnement" à "Réussite". Passez à l'étape suivante lorsque le résultat ressemble à ce qui suit :
Remarque : Vous pouvez ignorer l'avertissement Désolé, le serveur n'a pas pu traiter votre demande et passer à la tâche suivante.

Tester la tâche terminée
Cliquez sur Vérifier ma progression pour valider la tâche exécutée.
Créer un cluster
Tâche 2 : Envoyer un job à votre cluster
- Sélectionnez Jobs pour passer à la vue des jobs Managed Service pour Apache Spark :

- Cliquez sur Envoyer un job :

- Définissez les valeurs des paramètres listés ci-dessous et conservez les paramètres par défaut pour les autres :
| Paramètre |
Valeur |
| Région |
|
| Cluster |
|
| Type de job |
|
| Classe principale ou fichier JAR |
|
| Fichiers JAR |
|
| Arguments |
|
- Cliquez sur Envoyer.
Votre job doit apparaître dans la liste Jobs, qui affiche tous les jobs de votre projet avec leur cluster, leur type et leur état actuel. Le nouveau job s'affiche comme "En cours d'exécution". Lorsque l'état "Réussite" s'affiche, vous pouvez passer à l'étape suivante.
Tester la tâche terminée
Cliquez sur Vérifier ma progression pour valider la tâche exécutée.
Envoyer un job à votre cluster
- Pour voir le résultat du job terminé, cliquez sur l'ID du job dans la liste Jobs :

- Pour éviter de devoir faire défiler la page, sélectionnez Renvoi à la ligne sur ACTIVÉ :

Vous pouvez constater que votre job est parvenu à calculer une valeur approximative de pi !
Tâche 3 : Arrêter votre cluster
- Vous pouvez arrêter un cluster sur la page "Clusters" :

- Cochez la case à côté du cluster qlab, puis cliquez sur Supprimer :

- Cliquez sur CONFIRMER pour confirmer la suppression.
Tâche 4 : Tester vos connaissances
Voici quelques questions à choix multiples qui vous permettront de mieux maîtriser les concepts abordés lors de cet atelier. Répondez-y du mieux que vous le pouvez.
Félicitations !
Vous savez désormais comment créer un cluster Managed Service pour Apache Spark, envoyer un job Spark et arrêter votre cluster.
Étapes suivantes et informations supplémentaires
Formations et certifications Google Cloud
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 28 avril 2026
Dernier test de l'atelier : 28 avril 2026
Copyright 2026 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.