GSP123
Présentation
Managed Service pour Apache Spark est un service Spark et Hadoop géré qui vous
permet de bénéficier d'outils de données Open Source pour le traitement par
lot, le requêtage, les flux de données et le machine learning.
L'automatisation Managed Service pour Apache Spark vous permet de créer des
clusters rapidement, de les gérer facilement et de faire des économies en
désactivant ceux que vous n'utilisez plus. Vous consacrez moins de temps et
d'argent aux fonctions d'administration, ce qui vous permet de vous concentrer
sur les jobs et les données.
Cet atelier est une adaptation du guide
Créer un cluster Managed Service pour Apache Spark à l'aide de la console
Google Cloud.
Points abordés
-
Créer un cluster Managed Service pour Apache Spark (avec
Apache Spark préinstallé)
- Soumettre un job Spark
- Arrêter votre cluster
Préparation
Avant de cliquer sur le bouton "Démarrer l'atelier"
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
- Vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome).
Remarque : Ouvrez une fenêtre de navigateur en mode incognito (recommandé) ou de navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
- Vous disposez d'un temps limité. N'oubliez pas qu'une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Remarque : Utilisez uniquement le compte de participant pour cet atelier. Si vous utilisez un autre compte Google Cloud, des frais peuvent être facturés à ce compte.
Démarrer l'atelier et se connecter à la console Google Cloud
-
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, une boîte de dialogue s'affiche pour vous permettre de sélectionner un mode de paiement.
Sur la gauche, vous trouverez le panneau "Détails concernant l'atelier", qui contient les éléments suivants :
- Le bouton "Ouvrir la console Google Cloud"
- Le temps restant
- Les identifiants temporaires que vous devez utiliser pour cet atelier
- Des informations complémentaires vous permettant d'effectuer l'atelier
-
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).
L'atelier lance les ressources, puis ouvre la page "Se connecter" dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte.
-
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
{{{user_0.username | "Username"}}}
Vous trouverez également le nom d'utilisateur dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
-
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
{{{user_0.password | "Password"}}}
Vous trouverez également le mot de passe dans le panneau "Détails concernant l'atelier".
-
Cliquez sur Suivant.
Important : Vous devez utiliser les identifiants fournis pour l'atelier. Ne saisissez pas ceux de votre compte Google Cloud.
Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés.
-
Accédez aux pages suivantes :
- Acceptez les conditions d'utilisation.
- N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
- Ne vous inscrivez pas à des essais sans frais.
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Remarque : Pour accéder aux produits et services Google Cloud, cliquez sur le menu de navigation ou saisissez le nom du service ou du produit dans le champ Recherche.
Attribuer un rôle IAM nécessaire au compte de service Compute Engine
Pour attribuer l'autorisation de stockage au compte de service, qui est
requise pour créer un cluster :
-
Dans la console Google Cloud, accédez au menu de navigation (
), puis sélectionnez IAM et administration >
IAM.
-
Cliquez sur Modifier le principal (icône en forme de
crayon) pour le
compte de service Compute Engine par défaut
([numéro-projet]-compute@developer.gserviceaccount.com).
-
Cliquez sur + Ajouter un autre rôle.
-
Dans le champ Sélectionner un rôle, recherchez
Administrateur Storage, puis sélectionnez-le dans les
résultats.
-
Cliquez sur Enregistrer.
Tâche 1 : Créer un cluster
-
Dans la console Google Cloud, accédez au menu de navigation (
), puis cliquez sur Afficher tous les produits. Sous
Données analytiques, cliquez sur
Managed Apache Spark.
-
Pour créer un cluster, cliquez sur
Clusters > Créer un cluster.
-
Définissez les valeurs des paramètres listés ci-dessous et conservez les
paramètres par défaut pour les autres :
| Paramètre |
Valeur |
| Nom |
|
| Région |
|
| Zone |
|
|
Développez Configurations avancées >
Infrastructure, pour
Nœud du gestionnaire >
Type de disque principal.
|
Disque persistant standard |
| Nœud du gestionnaire : série |
E2 |
| Nœud du gestionnaire : type de machine |
|
| Nœud de gestionnaire : taille du disque principal |
30 Go |
| Nombre de nœuds de calcul |
2 |
| Nœud de calcul : type de disque principal |
Disque persistant standard |
| Nœud de calcul : série |
E2 |
| Nœud de calcul : type de machine |
|
| Nœud de calcul : taille du disque principal |
30 Go |
|
Développez Autre >
Adresse IP interne uniquement.
|
Désélectionnez
Configurer toutes les instances pour qu'elles ne possèdent que des
adresses IP internes.
|
-
Cliquez sur Créer pour créer le cluster. L'état passe de
"Provisionnement" à "Réussite". Passez à l'étape suivante lorsque le
résultat ressemble à ce qui suit :
Remarque : Vous pouvez ignorer l'avertissement Désolé, le serveur n'a pas pu traiter votre demande et passer à la tâche suivante.
Tester la tâche terminée
Cliquez sur Vérifier ma progression pour valider la tâche
exécutée.
Créer un cluster
Tâche 2 : Envoyer un job à votre cluster
-
Sélectionnez Jobs pour passer à la vue des jobs
Managed Service pour Apache Spark :
- Cliquez sur Envoyer un job :
-
Définissez les valeurs des paramètres listés ci-dessous et conservez les
paramètres par défaut pour les autres :
| Paramètre |
Valeur |
| Région |
|
| Cluster |
|
| Type de job |
|
| Classe principale ou fichier JAR |
|
| Fichiers JAR |
|
| Arguments |
|
- Cliquez sur Envoyer.
Votre job doit apparaître dans la liste Jobs, qui affiche tous les jobs de
votre projet avec leur cluster, leur type et leur état actuel. Le nouveau job
s'affiche comme "En cours d'exécution". Lorsque l'état "Réussite" s'affiche,
vous pouvez passer à l'étape suivante.
Tester la tâche terminée
Cliquez sur Vérifier ma progression pour valider la tâche
exécutée.
Envoyer un job à votre cluster
-
Pour voir le résultat du job terminé, cliquez sur l'ID du job dans la liste
Jobs :
-
Pour éviter de devoir faire défiler la page, sélectionnez
Renvoi à la ligne sur ACTIVÉ :
Vous pouvez constater que votre job est parvenu à calculer une valeur
approximative de pi !
Tâche 3 : Arrêter votre cluster
- Vous pouvez arrêter un cluster sur la page "Clusters" :
-
Cochez la case à côté du cluster qlab, puis cliquez sur
Supprimer :
- Cliquez sur CONFIRMER pour confirmer la suppression.
Tâche 4 : Tester vos connaissances
Voici quelques questions à choix multiples qui vous permettront de mieux
maîtriser les concepts abordés lors de cet atelier. Répondez-y du mieux que
vous le pouvez.
Félicitations !
Vous savez désormais comment créer un cluster Managed Service pour
Apache Spark, envoyer un job Spark et arrêter votre cluster.
Étapes suivantes et informations supplémentaires
Formations et certifications Google Cloud
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 28 avril 2026
Dernier test de l'atelier : 28 avril 2026
Copyright 2026 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.