arrow_back

Ознайомлення із загальнодоступним набором даних BigQuery

Get access to 700+ labs and courses

Ознайомлення із загальнодоступним набором даних BigQuery

Lab 1 година universal_currency_alt 5 кредитів show_chart Початковий
info This lab may incorporate AI tools to support your learning.
Get access to 700+ labs and courses

Огляд

Без відповідного апаратного забезпечення й інфраструктури на зберігання великих наборів даних і виконання відповідних запитів потрібно багато часу й коштів. Цю проблему може вирішити BigQuery – корпоративне сховище даних із надзвичайно швидкою обробкою запитів SQL завдяки обчислювальним ресурсам інфраструктури Google. Просто перенесіть дані в BigQuery, а ми подбаємо про решту. Ви можете контролювати доступ до проекту й даних відповідно до потреб компанії: надавати дозвіл на перегляд даних і виконання запитів цих даних.

Для доступу до BigQuery можна використовувати Cloud Console або інструмент командного рядка. Також можна надсилати виклики в BigQuery REST API, використовуючи різні клієнтські бібліотеки, як-от Java, .NET або Python. Для взаємодії з BigQuery, зокрема візуалізації і завантаження даних, підходять різні інструменти сторонніх розробників. У цій практичній роботі ви працюватимете з BigQuery через вебінтерфейс.

Вебінтерфейс BigQuery можна використовувати в Cloud Console як графічний інтерфейс для різних завдань, як-от виконання запитів, завантаження й експортування даних. У цій практичній роботі ви навчитеся виконувати запити таблиць у загальнодоступних наборах даних і завантажувати вибірки даних у BigQuery за допомогою Cloud Console.

Цілі

У цій практичній роботі ви навчитеся виконувати наведені нижче дії.

  • Виконувати запит до загальнодоступного набору даних
  • Створювати власну таблицю
  • Завантажувати дані в таблицю
  • Виконувати запит таблиці

Налаштування середовищ

Налаштування практичної роботи

Для кожної практичної роботи ви безкоштовно отримуєте новий проект Google Cloud і набір інструментів на визначений період часу.

  1. Увійдіть у Qwiklabs у вікні в режимі анонімного перегляду.

  2. Слідкуйте за тим, скільки часу залишилося для виконання практичної роботи (наприклад: 1:15:00). Постарайтеся завершити її вчасно.
    Завдання не можна призупинити, а лише почати спочатку.

  3. Коли будете готові, натисніть Start Lab (Почати практичну роботу).

  4. Занотуйте облікові дані для практичної роботи (ім’я користувача й пароль). Вони знадобляться для входу в Google Cloud Console.

  5. Натисніть Open Google Console (Відкрити Google Console).

  6. Виберіть Use another account (Увійти в інший обліковий запис), потім скопіюйте та вставте облікові дані для доступу до цієї практичної роботи у відповідні поля.
    Якщо ви ввійдете з іншими обліковими даними, станеться помилка або з вас може почати стягуватися плата.

  7. Прийміть умови й пропустіть сторінку відновлення ресурсу.

Відкрийте BigQuery в Console

  1. У Google Cloud Console виберіть Navigation menu (Меню навігації) > BigQuery.

Відкриється повідомлення Welcome to BigQuery in the Cloud Console (Вітаємо в BigQuery в Cloud Console). Це повідомлення містить посилання на короткий посібник і перелік оновлень інтерфейсу.

  1. Натисніть Done (Готово).

Завдання 1. Виконайте запит до загальнодоступного набору даних

У цьому завданні ви завантажите в BigQuery загальнодоступний набір даних USA Names ("Імена США"), а потім виконаєте запит даних із цього набору, щоб визначити найпоширеніші імена в США з 1910 по 2013 роки.

Завантажте набір даних USA Names

  1. На панелі Explorer (Провідник) знайдіть поле Type to search (Введіть пошуковий запит), введіть usa_names і натисніть клавішу Enter.

  2. Натисніть SEARCH ALL PROJECTS (ШУКАТИ В УСІХ ПРОЕКТАХ).

  3. На панелі Explorer (Провідник) наведіть курсор на проект bigquery-public-data, а потім натисніть значок Зірочка.

  4. У полі Type to search (Введіть пошуковий запит) введіть bigquery-public-data. Відобразяться всі набори даних у проекті.

Примітка. Якщо новий проект bigquery-public-data не відображається на панелі Explorer (Провідник), натисніть + ADD DATA (+ ДОДАТИ ДАНІ) > Star a project by name (Позначити проект зірочкою за назвою) > Star a project (Позначити проект зірочкою) (bigquery-public-data) і STAR (ПОЗНАЧИТИ ЗІРОЧКОЮ).
  1. Натисніть Expand node (Розгорнути вузол) для проекту bigquery-public-data.

  2. Знайдіть у списку загальнодоступних наборів даних usa_names. За потреби натисніть More Results (Інші результати).

  3. Щоб розгорнути набір даних, натисніть usa_names.

  4. Щоб відкрити таблицю, натисніть usa_1910_2013.

Виконайте запит до набору даних USA Names

Виконайте запит bigquery-public-data.usa_names.usa_1910_2013, щоб отримати із цього набору дані про імена й стать дітей, а потім складіть список із 10 найпопулярніших імен у порядку спадання.

  1. Натисніть Query (Запит) і виберіть In new tab (У новій вкладці).

  2. Скопіюйте наведений нижче запит і вставте його в текстове поле редактора запитів замість наявного запиту:

SELECT name, gender, SUM(number) AS total FROM `bigquery-public-data.usa_names.usa_1910_2013` GROUP BY name, gender ORDER BY total DESC LIMIT 10
  1. Перегляньте засіб перевірки запиту у верхньому правому куті вікна.

Засіб перевірки в редакторі запитів

Якщо запит дійсний, у BigQuery з’явиться значок зеленого прапорця, а якщо недійсний – значок червоного знака оклику. Крім того, для дійсного запиту в засобі перевірки відображається обсяг даних, що оброблятимуться. Це допомагає визначити вартість виконання запиту.

  1. Натисніть Run (Виконати).

Результати запиту з’являться під редактором запитів. Угорі розділу з результатами запиту показано, скільки часу минуло й скільки даних оброблено під час виконання запиту. Результати запиту відображаються в таблиці під інформацією про час. Рядок заголовка містить назву стовпця, зазначену в частині запиту GROUP BY (ГРУПУВАТИ ЗА).

Завдання 2. Створіть власну таблицю

У цьому завданні ви створюєте власну таблицю, завантажуєте в неї дані, а потім виконуєте запит до таблиці.

Завантажте дані на локальний комп’ютер

Ви завантажуєте файл, що містить приблизно 7 МБ даних про популярні дитячі імена, наданий Адміністрацією соціального страхування США.

  1. Завантажте файл .zip із даними про дитячі імена на локальний комп’ютер. Примітка. Якщо посилання для завантаження не працює, скопіюйте файл у розділі з ресурсами для слухачів на панелі ліворуч у посібнику з вказівками.
  2. Розархівуйте файл на своєму комп’ютері.
  3. Щоб переглянути дані, відкрийте файл із назвою yob2014.txt. Це файл CSV (зі значеннями, розділеними комами) з трьома стовпцями, у яких указано ім’я, стать (M (чол.) або F (жін.)) і кількість дітей із таким іменем. Файл не має рядка заголовка.
  4. Занотуйте розташування файлу yob2014.txt, щоб ви могли знайти його пізніше.

Завдання 3. Створіть набір даних

У цьому завданні ви створите набір даних, у якому міститиметься таблиця, додасте дані у власний проект, а потім побудуєте таблицю, з якої будете запитувати дані.

З наборами даних ви можете контролювати доступ до таблиць і представлень проекту. У цій практичній роботі використовується лише одна таблиця, проте для її розміщення все-таки потрібен набір даних.

  1. Поверніться до Cloud Console. На панелі Explorer (Провідник) видаліть bigquery-public-data з поля Type to search (Введіть пошуковий запит).
Примітка. Якщо ви використовували метод Star a project by name (Позначити проект зірочкою за назвою), прокрутіть сторінку вгору до перших результатів пошуку.
  1. Натисніть ідентифікатор проекту (він починається з qwiklabs).

Розділ Explorer (Провідник) і набір даних проекту в інтерфейсі Cloud Console

  1. Натисніть значок із трьома крапками поруч з ідентифікатором проекту й виберіть опцію Create dataset (Створити набір даних).

  2. Відкриється сторінка, на якій можна створити набір даних.

    • У полі Dataset ID (Ідентифікатор набору даних) введіть babynames.
    • У полі Data location (Місцезнаходження даних) виберіть us (multiple regions in United States).
    • У полі Default table expiration (Стандартний строк дії таблиці) залиште значення за умовчанням.
    • У полі Encryption (Шифрування) залиште значення за умовчанням.
  3. Унизу панелі натисніть Create dataset (Створити набір даних).

Завдання 4. Завантажте дані в нову таблицю

У цьому завданні ви завантажите дані в нову таблицю.

  1. На панелі Explorer (Провідник) розгорніть набір даних з ідентифікатором проекту.

  2. Натисніть значок із трьома крапками поруч із набором даних babynames і виберіть Create table (Створити таблицю).

Використовуйте стандартні значення для всіх налаштувань, якщо не зазначено інше.

  1. Виконайте описані нижче дії на сторінці Create table (Створити таблицю).

    • У розділі Source (Джерело) у спадному меню Create table from: (Створити таблицю на основі:) виберіть Upload (Завантажити).
    • У розділі Select file (Вибрати файл) натисніть Browse (Переглянути), перейдіть до файлу yob2014.txt і натисніть Open (Відкрити).
    • У полі File format (Формат файлу) виберіть CSV зі спадного меню.
    • У полі Table name (Назва таблиці) введіть names_2014.
    • У розділі Schema (Схема) натисніть перемикач Edit as text (Редагувати як текст) і вставте наведене нижче визначення схеми в текстове поле.
name:string,gender:string,count:integer
  1. Унизу вікна натисніть Create table (Створити таблицю).
Примітка. Навіть якщо ви побачите повідомлення про помилку імпорту, дані все одно мають бути імпортовані. Щоб повідомлення про помилку зникло, закрийте вікно: натисніть Close (Закрити), потім – Cancel (Скасувати), а коли з’явиться попередження про те, що зміни не збережуться, натисніть Yes, quit (Так, вийти).

Перегляньте таблицю

  1. На панелі Explorer (Провідник) виберіть набір даних babynames > names_2014.
  2. На панелі деталей натисніть Preview (Попередній перегляд).

Завдання 5. Виконайте запит таблиці

Ви вже завантажили дані в таблицю й тепер можете виконати запит даних. Кроки такі самі, як і в попередньому прикладі, але цього разу ви виконуєте запит до власної таблиці, а не загальнодоступної.

  1. У редакторі запитів натисніть Create SQL query (Створити запит SQL).
  2. Скопіюйте наведений нижче запит і вставте його в редактор запитів. Цей запит знаходить 5 найпопулярніших імен хлопчиків у США у 2014 році.
Примітка. Для значень у лапках враховується регістр, тому уважно вводьте назви набору даних і таблиці, які ви створили. SELECT name, count FROM `babynames.names_2014` WHERE gender = 'M' ORDER BY count DESC LIMIT 5
  1. Натисніть Run (Виконати). Результати відображаються під вікном запиту.

Вітаємо!

Ви виконали запит до загальнодоступного набору даних, потім побудували власну таблицю, завантажили туди дані й виконали запит до неї.

Завершіть завдання

Закінчивши виконувати завдання, натисніть кнопку End Lab (Завершити завдання). Google Cloud Skills Boost вилучить використані ресурси й очистить обліковий запис.

Ви зможете оцінити, наскільки вам сподобалося виконувати завдання на платформі. Виберіть потрібну кількість зірочок, введіть коментар і натисніть Submit (Надіслати).

Кількість зірочок відповідає певній оцінці:

  • 1 зірочка = зовсім не сподобалося
  • 2 зірочки = не сподобалося
  • 3 зірочки = не можу сказати напевно
  • 4 зірочки = сподобалося
  • 5 зірочок = дуже сподобалося

Якщо ви не хочете надсилати відгук, просто закрийте діалогове вікно.

Залишайте свої відгуки, пропозиції або коментарі на вкладці Support (Підтримка).

© Google LLC 2022. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.

Before you begin

  1. Labs create a Google Cloud project and resources for a fixed time
  2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
  3. On the top left of your screen, click Start lab to begin

Use private browsing

  1. Copy the provided Username and Password for the lab
  2. Click Open console in private mode

Sign in to the Console

  1. Sign in using your lab credentials. Using other credentials might cause errors or incur charges.
  2. Accept the terms, and skip the recovery resource page
  3. Don't click End lab unless you've finished the lab or want to restart it, as it will clear your work and remove the project

This content is not currently available

We will notify you via email when it becomes available

Great!

We will contact you via email if it becomes available

One lab at a time

Confirm to end all existing labs and start this one

Use private browsing to run the lab

Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.