Obtén acceso a más de 700 labs y cursos

Transferencia de nuevos conjuntos de datos a BigQuery v1.5

Lab 1 hora 30 minutos universal_currency_alt 5 créditos show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Obtén acceso a más de 700 labs y cursos

Descripción general

BigQuery es la base de datos estadísticos de Google de bajo costo, no-ops y completamente administrada. Con BigQuery, puedes consultar muchos terabytes de datos sin tener que administrar infraestructuras y sin necesitar un administrador de base de datos. BigQuery usa SQL y puede aprovechar el modelo de pago por uso. BigQuery te permite enfocarte en el análisis de datos para encontrar estadísticas valiosas.

Utilizarás un conjunto de datos de comercio electrónico que tiene millones de registros de Google Analytics para Google Merchandise Store cargados en BigQuery. Tienes una copia de ese conjunto de datos para este lab y explorarás los campos y las filas disponibles para obtener estadísticas.

En este lab, transferirás varios tipos de conjuntos de datos a tablas en BigQuery.

Configuración y requisitos

En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.

  1. Accede a Qwiklabs desde una ventana de incógnito.

  2. Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
    No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.

  3. Cuando esté listo, haga clic en Comenzar lab.

  4. Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.

  5. Haga clic en Abrir Google Console.

  6. Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
    Si usa otras credenciales, se generarán errores o incurrirá en cargos.

  7. Acepta las condiciones y omite la página de recursos de recuperación.

Abra BigQuery en Console

  1. En la consola de Google Cloud, seleccione elmenú de navegación > BigQuery.

Se abrirá el cuadro de mensaje Te damos la bienvenida a BigQuery en la consola de Cloud, Contiene un vínculo a la guía de inicio rápido y enumera las actualizaciones de la IU.

  1. Haga clic en Listo.

Tarea 1. Crea un nuevo conjunto de datos para almacenar las tablas

  1. En la consola de BigQuery, haz clic en los 3 puntos verticales junto al proyecto y, luego, selecciona Crear conjunto de datos.

La opción Crear conjunto de datos aparece resaltada en la IU

  1. Establece el ID de conjunto de datos en ecommerce. Deja los otros campos con sus valores predeterminados.

  2. Haz clic en Crear conjunto de datos.

Ahora verás el conjunto de datos ecommerce debajo del nombre de tu proyecto.

Tarea 2. Transfiere un nuevo conjunto de datos desde un archivo CSV

Situación: Los miembros de tu equipo de marketing esperan que los guíes con respecto a qué productos deben promocionar en función de los niveles de inventario. También preguntaron acerca de las tendencias de cada producto en las reseñas de los clientes según las opiniones sobre productos.

Tu conjunto de datos existente de transacciones de comercio electrónico no incluye niveles de inventario o datos de las opiniones sobre productos, pero tus equipos de operaciones y de marketing te proporcionaron conjuntos de datos nuevos para que los analices.

Esto es lo que debes hacer para comenzar:

  1. Descarga el conjunto de datos con el nivel de stock de los productos en tu computadora de forma local.

  2. Selecciona el conjunto de datos ecommerce y, luego, haz clic en Crear tabla.

El botón Crear tabla y el conjunto de datos ecommerce aparecen destacados

  1. Especifica las siguientes opciones de tabla:

Fuente:

  • Crear tabla desde: Subir
  • Seleccionar archivo: Selecciona el archivo que descargaste antes de forma local
  • Formato de archivo: CSV

Destino:

  • Nombre de la tabla: products

  • Deja el resto de la configuración con sus valores predeterminados.

Esquema:

  • Marca Detección automática en Esquema y parámetros de entrada

Sugerencia: ¿No ves la casilla de verificación? Asegúrate de que el formato de archivo sea CSV y no Avro.

  • Configuración de partición y agrupamiento en clústeres: Deja la configuración predeterminada

Opciones avanzadas:

  • Deja la configuración predeterminada
  1. Haz clic en Crear tabla.

Ahora deberías ver la tabla products debajo del conjunto de datos ecommerce.

  1. Selecciona la tabla de productos y mira los detalles:

La pestaña Detalles de la tabla de productos

  1. Selecciona Vista previa y confirma que se hayan cargado todas las columnas (muestra a continuación):

SKU

name

orderedQuantity

stockLevel

restockingLeadTime

GGOEGDHQ014899

20 oz Stainless Steel Insulated Tumbler

499

652

2

GGOEGOAB022499

Satin Black Ballpoint Pen

403

477

2

GGOEYHPB072210

Twill Cap

1429

1997

2

GGOEGEVB071799

Pocket Bluetooth Speaker

214

246

2

Cargaste correctamente un archivo CSV a una nueva tabla de BigQuery.

Explora los datos cargados recientemente con SQL

A continuación, practica con una consulta básica para obtener estadísticas de la nueva tabla de productos.

  • En el Editor de consultas, escribe una consulta para enumerar los 5 productos principales con el valor más alto de nivel de inventario (stockLevel):
#standardSQL SELECT * FROM ecommerce.products ORDER BY stockLevel DESC LIMIT 5

Tarea 3. Transfiere datos desde Google Cloud Storage

  1. Selecciona el conjunto de datos ecommerce y haz clic en Crear tabla.

  2. Especifica las siguientes opciones de tabla:

Fuente:

  • Crear tabla desde: Google Cloud Storage
  • Selecciona un archivo del bucket de GCS: cloud-training/data-insights-course/exports/products.csv
  • Formato de archivo: CSV

Destino:

  • Nombre de la tabla: products

  • Deja el resto de la configuración con sus valores predeterminados.

Esquema:

  • Marca Detección automática en Esquema y parámetros de entrada

Opciones avanzadas:

  • Deja la configuración predeterminada
  1. Haz clic en Crear tabla.

¿Funciona? No.

  1. Haz clic en Cerrar para cerrar el mensaje y, luego, en Cancelar, en el diálogo Crear tabla.

  2. En el menú de la izquierda, haz clic en Historial del proyecto y selecciona el mensaje de error.

En la pestaña Historial del proyecto se refleja el mensaje de error destacado

  1. Haz clic en el botón Repetir trabajo de carga.

  2. En el formulario Crear tabla, haz clic en Opciones avanzadas y, en el menú desplegable Preferencia de escritura, selecciona Reemplazar tabla.

  3. Ahora haz clic en Crear tabla.

  4. Confirma que la tabla se haya ejecutado correctamente.

Tarea 4. Transfiere un nuevo conjunto de datos desde un documento de Hojas de cálculo de Google

  1. Selecciona Redactar consulta nueva.

  2. Ejecuta la siguiente consulta para mostrar qué productos es necesario reabastecer con mayor urgencia en función de la rotación del inventario y la velocidad con la que pueden reabastecerse:

#standardSQL SELECT *, SAFE_DIVIDE(orderedQuantity,stockLevel) AS ratio FROM ecommerce.products WHERE # include products that have been ordered and # are 80% through their inventory orderedQuantity > 0 AND SAFE_DIVIDE(orderedQuantity,stockLevel) >= .8 ORDER BY restockingLeadTime DESC Nota: Si especificas una ruta de acceso relativa del nombre del proyecto como ecommerce.products en lugar de project_id.ecommerce.products, BigQuery usará el proyecto actual.

Tarea 5. Guarda datos en Hojas de cálculo de Google

Situación: Quieres darle a tu equipo de administración de la cadena de suministro una manera de registrar los pedidos de reabastecimiento que se realizaron al proveedor y agregar comentarios sobre los artículos. Decides usar un documento de Hojas de cálculo de Google para hacer una breve encuesta.

Ahora crearás dicho documento:

  1. En Resultados de la consulta, selecciona Guardar los resultados > Hojas de cálculo de Google.

El menú desplegable Guardar los resultados expandido

  1. Aparecerá una ventana emergente con un vínculo para abrir la hoja de cálculo. Selecciona Abrir.

  2. En tu hoja de cálculo, en la columna G, agrega un nuevo campo titulado comments y, para la primera fila de productos, escribe nuevo envío en camino.

La columna G destacada

  1. En el documento de Hojas de cálculo de Google, selecciona Compartir y Obtener vínculo para compartir. Luego, copia el vínculo.

  2. Regresa a la pestaña de BigQuery.

  3. Haz clic en el conjunto de datos ecommerce y, luego, en Crear tabla.

  4. Especifica las siguientes opciones de tabla:

Fuente:

  • Crear tabla desde: Drive
  • Seleccionar URI de Drive: escriba-la-url-de-su-hoja-de-cálculo-aquí
  • Formato de archivo: Hoja de cálculo de Google

Destino:

  • Tipo de tabla: Deja los valores predeterminados (tabla externa)
  • Nombre de la tabla: products_comments

Esquema:

  • Marca Detección automática en Esquema y parámetros de entrada

El diálogo Crear tabla

Opciones avanzadas:

  • Establece Filas del encabezado que se omitirán: en 1.
  • Deja todas las opciones con sus valores predeterminados.
  1. Haz clic en Crear tabla.
Nota: No hay ningún trabajo de carga para crear una tabla con vínculos externos, ya que los datos no se transfieren.

Consulta los datos de una hoja de cálculo externa

  1. Haz clic en Redactar consulta nueva.

  2. Agrega la siguiente consulta y, luego, ejecútala:

#standardSQL SELECT * FROM ecommerce.products_comments WHERE comments IS NOT NULL

Espera a que se ejecute la consulta. Verás que ahora se muestra el nuevo campo comments.

SKU

name

orderedQuantity

stockLevel

restockingLeadTime

ratio

comments

GGOENEBB078899

Cam Indoor Security Camera - USA

2139

2615

42

0.8179732314

nuevo envío en camino

  1. Regresa a la pestaña de tu documento de Hojas de cálculo de Google.

  2. Escribe más comentarios en el campo comments.

  3. Regresa a BigQuery y haz clic en Ejecutar para ejecutar la consulta nuevamente.

  4. Confirma que los nuevos datos se muestren en los resultados de forma adecuada.

Creaste correctamente una conexión de una tabla externa con BigQuery desde Hojas de cálculo de Google.

Tarea 6. Conoce las consideraciones sobre la calidad de los datos y el rendimiento de tablas externas

Existen varias limitaciones cuando se vinculan tablas externas a BigQuery (p. ej., Hojas de cálculo de Google o directamente desde Google Cloud Storage). Las siguientes son dos de las más significativas:

  • No se garantiza la coherencia de los datos si se cambian los valores de los datos en el origen mientras se realizan consultas.
  • Las fuentes de datos almacenadas fuera de BigQuery pierden los beneficios de rendimiento asociados con permitir que BigQuery administre el almacenamiento de tus datos (esto incluye, sin limitaciones, la optimización automática de tu ruta de acceso de ejecución de la consulta, la inhabilitación de ciertas funciones comodín, etcétera).

¡Felicitaciones!

Creaste correctamente un nuevo conjunto de datos y transferiste nuevas fuentes de datos externas a BigQuery desde un archivo CSV, Google Cloud Storage y Google Drive.

Finalice su lab

Cuando haya completado el lab, haga clic en Finalizar lab. Google Cloud Skills Boost quitará los recursos que usó y limpiará la cuenta.

Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.

La cantidad de estrellas indica lo siguiente:

  • 1 estrella = Muy insatisfecho
  • 2 estrellas = Insatisfecho
  • 3 estrellas = Neutral
  • 4 estrellas = Satisfecho
  • 5 estrellas = Muy satisfecho

Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.

Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.

Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Antes de comenzar

  1. Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
  2. .
  3. Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
  4. En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar

Usa la navegación privada

  1. Copia el nombre de usuario y la contraseña proporcionados para el lab
  2. Haz clic en Abrir la consola en modo privado

Accede a la consola

  1. Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
  2. Acepta las condiciones y omite la página de recursos de recuperación
  3. No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible

Un lab a la vez

Confirma para finalizar todos los labs existentes y comenzar este

Usa la navegación privada para ejecutar el lab

Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.