Lab setup instructions and requirements
Protect your account and progress. Always use a private browser window and lab credentials to run this lab.

Dataproc: Qwik Start – консоль

Lab 20 годин universal_currency_alt 1 кредит show_chart Початковий
info This lab may incorporate AI tools to support your learning.
This content is not yet optimized for mobile devices.
For the best experience, please visit us on a desktop computer using a link sent by email.

GSP103

Логотип Google Cloud Self-Paced Labs

Огляд

Dataproc – це швидкий, зручний і простий у керуванні хмарний сервіс для запуску кластерів Apache Spark та Apache Hadoop без зайвих клопотів і витрат. Дії, що раніше тривали кілька годин або днів, тепер можна виконати за лічені хвилини чи навіть секунди. Завдяки цьому сервісу можна швидко створювати кластери Dataproc і будь-коли змінювати їх розмір відповідно до ваших потреб в обробці даних.

Під час цього практичного заняття ви навчитеся створювати кластер Dataproc, виконувати в ньому просте завдання Apache Spark і змінювати кількість робочих вузлів за допомогою консолі Google Cloud.

Завдання

Під час цього практичного заняття ви навчитеся виконувати наведені нижче дії.

  • Створювати кластер Dataproc у консолі Google Cloud
  • Виконувати просте завдання Apache Spark
  • Змінювати кількість робочих вузлів у кластері

Налаштування й вимоги

Перш ніж натиснути кнопку Start Lab (Почати практичну роботу)

Ознайомтеся з наведеними нижче вказівками. На виконання практичного заняття відводиться обмежений час, і його не можна призупинити. Щойно ви натиснете Почати заняття, з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.

Ви зможете виконати практичне заняття в дійсному робочому хмарному середовищі (не в симуляції або демонстраційному середовищі). Для цього на час практичного заняття вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.

Для цього практичного заняття потрібно мати:

  • стандартний вебпереглядач, наприклад Chrome (рекомендовано);
Примітка. Виконуйте практичне заняття в анонімному вікні вебпереглядача (рекомендовано). Так ви уникнете додаткової плати, що може стягуватися з вашого особистого облікового запису внаслідок його помилкового використання замість облікового запису для навчання.
  • достатню кількість часу, оскільки почавши практичне заняття, ви не зможете призупинити його.
Примітка. Для виконання цього практичного заняття використовуйте лише обліковий запис для навчання, оскільки з іншого облікового запису Google Cloud може стягуватися плата.

Як почати виконувати практичну роботу й увійти в Google Cloud Console

  1. Натисніть кнопку Start Lab (Почати практичне заняття). Якщо за практичне заняття необхідно заплатити, відкриється вікно, де ви зможете обрати спосіб оплати. Ліворуч розміщено панель "Відомості про практичне заняття" з такими компонентами:

    • кнопка "Відкрити консоль Google";
    • час до закінчення;
    • тимчасові облікові дані, які потрібно використовувати для доступу до цього практичного заняття;
    • інша інформація, необхідна для виконання цього практичного заняття.
  2. Натисніть Відкрити консоль Google або натисніть правою кнопкою миші й виберіть Відкрити анонімне вікно, якщо ви використовуєте вебпереглядач Chrome.

    Завантажаться необхідні ресурси. Потім відкриється нова вкладка зі сторінкою "Увійти".

    Порада. Упорядковуйте вкладки в окремих вікнах, розміщуючи їх поруч.

    Примітка. Якщо з’явиться вікно Виберіть обліковий запис, натисніть Вибрати інший обліковий запис.
  3. За потреби скопіюйте значення в полі Username (Ім’я користувача) нижче й вставте його у вікні Вхід.

    {{{user_0.username | "Username"}}}

    Поле "Ім’я користувача" також можна знайти на панелі "Відомості про практичне заняття".

  4. Натисніть Далі.

  5. Скопіюйте значення в полі Password (Пароль) нижче й вставте його у вікні Welcome (Привітання).

    {{{user_0.password | "Password"}}}

    Поле "Пароль" також можна знайти на панелі "Відомості про практичне заняття".

  6. Натисніть Далі.

    Важливо. Обов’язково використовуйте облікові дані, призначені для відповідного практичного заняття. Не використовуйте облікові дані Google Cloud. Примітка. Якщо ввійти у власний обліковий запис Google Cloud, може стягуватися додаткова плата.
  7. Що від вас очікується

    • Прийміть Умови використання.
    • Не додавайте способи відновлення й двохетапну перевірку (оскільки це тимчасовий обліковий запис).
    • Не реєструйте безкоштовні пробні версії.

Через кілька секунд консоль Google Cloud відкриється в новій вкладці.

Примітка. Щоб отримати доступ до продуктів і сервісів Google Cloud, натисніть меню навігації або введіть назву сервісу чи продукту в полі пошуку. Значок меню навігації і поле пошуку

Переконайтеся, що Cloud Dataproc API увімкнено

Щоб створити кластер Dataproc у Google Cloud, слід увімкнути Cloud Dataproc API. Переконайтеся, що API увімкнено.

  1. Натисніть меню навігації > APIs & Services (API і сервіси) > Library (Бібліотека).

  2. Введіть Cloud Dataproc у вікні Search for APIs & Services (Пошук API і сервісів). У результатах пошуку на консолі з’явиться Cloud Dataproc API.

  3. Натисніть Cloud Dataproc API, щоб переглянути статус. Якщо цей інтерфейс API не ввімкнено, натисніть кнопку Enable (Увімкнути).

Увімкнувши API, виконуйте вказівки практичного заняття.

Надайте сервісному обліковому запису необхідні дозволи

Щоб створити кластер, потрібно надати сервісному обліковому запису дозвіл на доступ до сховища.

  1. Відкрийте меню навігації і виберіть IAM & Admin (Адміністрування й керування ідентифікацією і доступом) > IAM.

  2. Натисніть значок олівця біля сервісного облікового запису compute@developer.gserviceaccount.com.

  3. Натисніть кнопку + ADD ANOTHER ROLE (+ ДОДАТИ ІНШУ РОЛЬ) і виберіть роль Storage Admin (Адміністратор сховища).

Вибравши потрібну роль, натисніть Save (Зберегти).

Завдання 1. Створіть кластер

  1. У меню навігації консолі Google Cloud виберіть View All Products (Переглянути всі продукти), а потім у розділі Analytics (Аналітика) натисніть Dataproc > Clusters (Кластери).

  2. Натисніть Create cluster (Створити кластер).

  3. Налаштуйте для кластера наведені нижче поля й залиште в решті полів значення за умовчанням.

Примітка. Переконайтеся, що в розділі Configure nodes (Конфігурація вузлів) для керуючого й робочих вузлів правильно вибрано серію і тип машини. Якщо серія E2 не відображається, переконайтеся, що ви вибрали Standard Persistent Disk (Стандартний довгочасний диск) як тип основного диска.
Поле Значення
Name (Назва) example-cluster
Region (Регіон)
Zone (Зона)
Натисніть Configure nodes (Конфігурація вузлів) і в розділі Manager node (Керуючий вузол) виберіть Primary disk type (Тип основного диска) Standard Persistent Disk (Стандартний довгочасний диск)
Machine Series (Серія машини) у розділі Manager Node (Керуючий вузол) E2
Machine Type (Тип машини) у розділі Manager Node (Керуючий вузол) e2-standard-2
Primary disk size (Розмір основного диска) у розділі Manager Node (Керуючий вузол) 30 GB (30 ГБ)
Number of Worker Nodes (Кількість робочих вузлів) 2
Primary disk type (Тип основного диска) у розділі Worker Nodes (Робочі вузли) Standard Persistent Disk (Стандартний довгочасний диск)
Machine Series (Серія машини) у розділі Worker Nodes (Робочі вузли) E2
Machine Type (Тип машини) у розділі Worker Nodes (Робочі вузли) e2-standard-2
Primary disk size (Розмір основного диска) у розділі Worker Nodes (Робочі вузли) 30 GB (30 ГБ)
Натисніть Customize cluster (Налаштування кластера) і знайдіть розділ Internal IP only (Лише внутрішні IP-адреси) Зніміть прапорець Configure all instances to have only internal IP addresses (Налаштувати для всіх екземплярів лише внутрішні IP-адреси)
Примітка. Zone (Зона) – це спеціальний простір імен для кількох регіонів, що використовується для розгортання екземплярів у всіх зонах Google Compute у всьому світі. Також можна вказати конкретні регіони, наприклад us-central1 або europe-west1, щоб ресурси (зокрема екземпляри віртуальних машин та Cloud Storage) і метадані, що використовуються в Cloud Dataproc, зберігались у межах указаного вами регіону.
  1. Натисніть Create (Створити), щоб створити кластер.

Новий кластер з’явиться в списку Clusters (Кластери) через кілька хвилин. Спочатку він матиме статус Provisioning (Надання доступу), а коли буде готовий до використання – статус Running (Активний).

Перевірка виконаного завдання

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання.

Створіть кластер Dataproc

Завдання 2. Надішліть завдання

Щоб запустити тестове завдання Spark, виконайте наведені нижче дії.

  1. На панелі ліворуч натисніть Jobs (Завдання), щоб перейти до перегляду завдань Dataproc, а потім натисніть Submit job (Надіслати завдання).

  2. Налаштуйте наведені нижче поля, щоб оновити завдання, а в решті полів залиште значення за умовчанням.

Поле Значення
Region (Регіон)
Cluster (Кластер) example-cluster
Job type (Тип завдання) Spark
Main class or jar (Основний клас або файл JAR) org.apache.spark.examples.SparkPi
Jar files (Файли JAR) file:///usr/lib/spark/examples/jars/spark-examples.jar
Arguments (Аргументи) 1000 (кількість підпорядкованих завдань)
  1. Натисніть Submit (Надіслати).
Примітка. Як завдання визначає число пі. Завдання Spark обчислює значення числа пі методом Монте-Карло. Воно генерує точки x,y на площині координат, будуючи модель кола всередині одиничного квадрата. Вхідний аргумент (1000) визначає, скільки пар x,y потрібно згенерувати: що більше пар, то вища точність обчислення. Щоб розпаралелити обчислення, використовуються робочі вузли Cloud Dataproc. Більше інформації наведено в статтях Визначення числа пі методом Монте-Карло й JavaSparkPi.java на GitHub.

Завдання має з’явитися в списку на сторінці Jobs (Завдання), де відображається інформація про завдання вашого проєкту, зокрема про відповідний кластер, тип і поточний статус. Спочатку завдання матиме статус Running (Активне), а після виконання – Succeeded (Виконано).

Перевірка виконаного завдання

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання.

Надішліть завдання

Завдання 3. Перегляньте вивід завдання

Щоб переглянути вивід завдання, виконайте наведені нижче дії.

  1. Натисніть ідентифікатор завдання в списку Jobs (Завдання).

  2. Щоб переглянути значення числа пі, увімкніть опцію LINE WRAP (ПЕРЕНЕСЕННЯ РЯДКА) (значення ON) або прокрутіть сторінку до кінця праворуч. Після цього вивід виглядатиме десь так:

Вивід

Приблизне значення числа пі отримано.

Завдання 4. Змініть кількість робочих вузлів у кластері

Щоб змінити кількість робочих екземплярів у кластері, виконайте наведені нижче дії.

  1. Виберіть Clusters (Кластери) на панелі навігації ліворуч, щоб повернутися до перегляду кластерів Dataproc.

  2. У списку Clusters (Кластери) натисніть example-cluster. За умовчанням на сторінці відображається показник використання ЦП кластером.

  3. Щоб переглянути поточні налаштування кластера, натисніть Configuration (Конфігурація).

  4. Натисніть Edit (Редагувати). Тепер можна змінювати кількість робочих вузлів.

  5. Введіть 4 в полі Worker nodes (Робочі вузли).

  6. Натисніть Save (Зберегти).

Кластер оновлено. Перевірте кількість екземплярів віртуальної машини в кластері.

Перевірка виконаного завдання

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання.

Оновіть кластер
  1. Щоб повторно виконати завдання з оновленим кластером, потрібно натиснути Jobs (Завдання) на панелі ліворуч, а потім – SUBMIT JOB (НАДІСЛАТИ ЗАВДАННЯ).

  2. Налаштуйте в розділі Submit a job (Надіслати завдання) ті самі поля:

Поле Значення
Region (Регіон)
Cluster (Кластер) example-cluster
Job type (Тип завдання) Spark
Main class or jar (Основний клас або файл JAR) org.apache.spark.examples.SparkPi
Jar files (Файли JAR) file:///usr/lib/spark/examples/jars/spark-examples.jar
Arguments (Аргументи) 1000 (кількість підпорядкованих завдань)
  1. Натисніть Submit (Надіслати).

Завдання 5. Перевірте свої знання

Дайте відповіді на запитання з кількома варіантами відповіді нижче, щоб закріпити розуміння понять, які зустрічаються в цьому практичному занятті.

Вітаємо!

Тепер ви знаєте, як створити й оновити кластер Dataproc, а також надіслати в ньому завдання за допомогою консолі Google Cloud.

Наступні кроки/Докладніше

Це заняття також входить до низки практичних занять під назвою Qwik Starts. Вони призначені для ознайомлення з функціями Google Cloud. Такі практичні заняття можна знайти в каталозі за запитом "Qwik Starts".

Навчання й сертифікація Google Cloud

…допомагають ефективно використовувати технології Google Cloud. Наші курси передбачають опанування технічних навичок, а також ознайомлення з рекомендаціями, що допоможуть вам швидко зорієнтуватися й вивчити матеріал. Ми пропонуємо курси різних рівнів – від базового до високого. Ви можете вибрати формат навчання (за запитом, онлайн або офлайн) відповідно до власного розкладу. Пройшовши сертифікацію, ви перевірите й підтвердите свої навички та досвід роботи з технологіями Google Cloud.

Посібник востаннє оновлено 17 лютого 2026 року

Практичне заняття востаннє протестовано 17 лютого 2026 року

© Google LLC 2026. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.

Before you begin

  1. Labs create a Google Cloud project and resources for a fixed time
  2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
  3. On the top left of your screen, click Start lab to begin

Use private browsing

  1. Copy the provided Username and Password for the lab
  2. Click Open console in private mode

Sign in to the Console

  1. Sign in using your lab credentials. Using other credentials might cause errors or incur charges.
  2. Accept the terms, and skip the recovery resource page
  3. Don't click End lab unless you've finished the lab or want to restart it, as it will clear your work and remove the project

This content is not currently available

We will notify you via email when it becomes available

Great!

We will contact you via email if it becomes available

One lab at a time

Confirm to end all existing labs and start this one

Use private browsing to run the lab

Using an Incognito or private browser window is the best way to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.