arrow_back

Explora un conjunto de datos públicos de BigQuery

Acceder Unirse
Obtén acceso a más de 700 labs y cursos

Explora un conjunto de datos públicos de BigQuery

Lab 1 hora universal_currency_alt 5 créditos show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Obtén acceso a más de 700 labs y cursos

Descripción general

Almacenar y consultar grandes conjuntos de datos puede consumir bastante tiempo y dinero cuando no se cuenta con el hardware y la infraestructura adecuados. BigQuery es un almacén de datos para empresas que resuelve este problema, ya que permite realizar consultas de SQL superrápidas gracias al poder de procesamiento de la infraestructura de Google. Simplemente mueve tus datos a BigQuery y déjanos el trabajo duro a nosotros. Puedes controlar el acceso al proyecto y a tus datos (por ejemplo, puedes otorgar permisos de visualización o consulta de datos) según tus necesidades empresariales.

Para acceder a BigQuery, puedes usar la consola de Cloud, la herramienta de línea de comandos o realizar llamadas a la API de REST de BigQuery mediante diversas bibliotecas cliente, como Java, .NET o Python. También hay diferentes herramientas de terceros que puedes usar para interactuar con BigQuery, por ejemplo, si quieres visualizar o cargar datos. En este lab, accederás a BigQuery mediante la IU web.

Puedes usar la IU web de BigQuery en la consola de Cloud como una interfaz visual para completar tareas, por ejemplo, la ejecución de consultas y la carga y exportación de datos. En este lab práctico aprenderás a consultar tablas en un conjunto de datos públicos y a cargar datos de muestra en BigQuery con la consola de Cloud.

Objetivos

En este lab, aprenderás a realizar las siguientes tareas:

  • Consultar un conjunto de datos públicos
  • Crear una tabla personalizada
  • Cargar datos en una tabla
  • Consultar una tabla

Configura tus entornos

Configuración del lab

En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.

  1. Accede a Qwiklabs desde una ventana de incógnito.

  2. Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
    No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.

  3. Cuando esté listo, haga clic en Comenzar lab.

  4. Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.

  5. Haga clic en Abrir Google Console.

  6. Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
    Si usa otras credenciales, se generarán errores o incurrirá en cargos.

  7. Acepta las condiciones y omite la página de recursos de recuperación.

Abra BigQuery en Console

  1. En Google Cloud Console, seleccione el menú de navegación > BigQuery.

Se abrirá el cuadro de mensaje Te damos la bienvenida a BigQuery en Cloud Console, que contiene un vínculo a la guía de inicio rápido y enumera las actualizaciones de la IU.

  1. Haga clic en Listo.

Tarea 1: Consulta un conjunto de datos públicos

En esta tarea, cargarás un conjunto de datos públicos, USA Names, en BigQuery. Luego, consultarás el conjunto de datos para determinar cuáles fueron los nombres más comunes en EE.UU. entre 1910 y 2013.

Carga el conjunto de datos USA Names

  1. En el panel Explorador, en Comienza a escribir para buscar, escribe usa_names y presiona Intro.

  2. Haz clic en BUSCAR EN TODOS LOS PROYECTOS.

  3. En el panel Explorador, coloca el puntero sobre bigquery-public-data y, luego, haz clic en Destacar Destacar.

  4. En el campo Escribir para buscar, escribe bigquery-public-data. Se mostrarán todos los conjuntos de datos del proyecto.

Nota: Si el proyecto nuevo bigquery-public-data no aparece en el panel Explorador, haz clic en + AGREGAR DATOS > Destaca un proyecto por nombre > Destacar proyecto (bigquery-public-data) y DESTACAR.
  1. Haz clic en Expandir nodo para bigquery-public-data.

  2. Desplázate hacia abajo en la lista de conjuntos de datos públicos, haz clic en Más resultados hasta que encuentres usa_names.

  3. Haz clic en usa_names para expandir el conjunto de datos.

  4. Haz clic en usa_1910_2013 para abrir esa tabla.

Consulta el conjunto de datos USA Names

Consulta bigquery-public-data.usa_names.usa_1910_2013 para conocer el nombre y el sexo de los bebés que se incluyen en este conjunto de datos. Luego, haz una lista de los 10 nombres principales en orden descendente.

  1. Haz clic en Consulta y selecciona En una pestaña nueva.

  2. Copia y pega la siguiente consulta en el área de texto del Editor de consultas y reemplaza la consulta existente:

SELECT name, gender, SUM(number) AS total FROM `bigquery-public-data.usa_names.usa_1910_2013` GROUP BY name, gender ORDER BY total DESC LIMIT 10
  1. En la parte superior derecha de la ventana, observarás el validador de consultas.

El validador de consultas destacado en el Editor de consultas

Si la consulta es válida, BigQuery mostrará un ícono de marca de verificación verde. Si no lo es, aparecerá un ícono de signo de exclamación rojo. Si la consulta es válida, el validador también mostrará la cantidad de datos que procesará la consulta cuando la ejecute. Esto te permitirá determinar el costo de ejecutar la consulta.

  1. Haz clic en Ejecutar.

Los resultados de la consulta se abren debajo del editor de consultas. En la parte superior de la sección Resultados de la consulta, BigQuery muestra el tiempo transcurrido y los datos que procesó la consulta. Debajo del tiempo, se encuentra la tabla que muestra los resultados correspondientes. La fila del encabezado contiene el nombre de la columna según se especifica en el parámetro GROUP BY de la consulta.

Tarea 2: Crea una tabla personalizada

En esta tarea, crearás una tabla personalizada, le cargará datos y, luego, ejecutará una consulta en ella.

Descarga los datos en tu computadora local

El archivo que vas a descargar contiene alrededor de 7 MB de datos con nombres populares de bebés. Lo proporciona la Administración de Seguridad Social de EE.UU.

  1. Descarga el archivo ZIP de nombres de bebés en tu computadora local. Nota: Si el vínculo de descarga no funciona, copia el archivo ZIP de nombres de bebés que se encuentra en los recursos del alumno, en el panel izquierdo de la guía de instrucciones.
  2. Descomprime el archivo en la computadora.
  3. Abre el archivo yob2014.txt para consultar cómo se ven los datos. Este es un archivo de valores separados por comas (CSV) que contiene las siguientes tres columnas: nombre, sexo (M o F) y cantidad de niños que tienen ese nombre. El archivo no tiene una fila de encabezado.
  4. Presta atención a la ubicación del archivo yob2014.txt de modo que puedas encontrarlo más adelante.

Tarea 3: Crea un conjunto de datos

En esta tarea, crearás un conjunto de datos que incluya tu tabla, agregarás datos a tu proyecto y, luego, crearás la tabla de datos en la que ejecutarás la consulta.

Los conjuntos de datos lo ayudan a controlar el acceso a las tablas y las vistas de un proyecto. En este lab usarás una sola tabla, pero igualmente necesitarás un conjunto de datos en el cual incluirla.

  1. Vuelve a la consola de Cloud. En el panel Explorador borra bigquery-public-data del cuadro Comienza a escribir para buscar.
Nota: Si usaste el método para Destacar proyectos por nombre, vuelve a desplazarte hasta la parte superior de los resultados de la búsqueda.
  1. Haz clic en el ID del proyecto (que empezará con qwiklabs).

La consola de Cloud con la sección Explorador y el conjunto de datos de tu proyecto destacados

  1. Haz clic en los tres puntos que aparecen junto al ID del proyecto y, luego, en Crear un conjunto de datos.

  2. En la página Crear un conjunto de datos:

    • En ID del conjunto de datos, ingresa babynames.
    • En Ubicación de los datos, elige us (varias regiones en Estados Unidos).
    • En Vencimiento predeterminado de la tabla, deja el valor predeterminado.
    • En Encriptación, deja el valor predeterminado.
  3. En la parte inferior del panel, haz clic en Crear conjunto de datos.

Tarea 4: Carga los datos en una tabla nueva

En esta tarea, cargarás los datos en la tabla que creaste.

  1. En el panel Explorador, expande el conjunto de datos del ID del proyecto.

  2. Haz clic en los tres puntos junto a babynames y, luego, haz clic en Crear tabla.

Usa los valores predeterminados en todos los parámetros de configuración, a menos que se indique lo contrario.

  1. En la página Crear tabla, sigue estos pasos:

    • En Fuente, selecciona Subir del menú desplegable Crear tabla desde:.
    • En Seleccionar archivo, haz clic en Explorar, navega hasta el archivo yob2014.txt y, luego, haz clic en Abrir.
    • En Formato del archivo, elige CSV del menú desplegable.
    • En Nombre de la tabla, ingresa names_2014.
    • En la sección Esquema, haz clic en el botón de activación Editar como texto y pega la siguiente definición de esquema en el cuadro de texto.
name:string,gender:string,count:integer
  1. Haz clic en Crear tabla (en la parte inferior de la ventana).
Nota: Aunque aparezca un error de importación, tus datos deberían haberse importado de igual manera. Para solucionar el error, haz clic en Cerrar y, luego, en Cancelar para que desaparezca el cuadro de diálogo de importación. Por último, haz clic en Sí, salir como respuesta a la advertencia de que los cambios no se guardarán.

Obtén una vista previa de la tabla

  1. En el panel Explorador, selecciona babynames > names_2014.
  2. En el panel de detalles, haz clic en la pestaña Vista previa.

Tarea 5: Consulta la tabla

Una vez cargados los datos en tu tabla, puedes ejecutar consultas. El proceso es idéntico al del ejemplo anterior, excepto que, en este caso, consultarás tu tabla en lugar de una tabla pública.

  1. En el editor de consultas, haz clic en Crear consulta SQL.
  2. Copia y pega la siguiente consulta en el Editor de consultas. Esta consulta recupera los 5 nombres de bebés de sexo masculino más populares en EE.UU. durante el 2014.
Nota: Dentro de “ ” se distingue entre mayúsculas y minúsculas, así que asegúrate de alinear exactamente los nombres del conjunto de datos y la tabla que creaste. SELECT name, count FROM `babynames.names_2014` WHERE gender = 'M' ORDER BY count DESC LIMIT 5
  1. Haz clic en Ejecutar. Los resultados se mostrarán debajo de la ventana de consulta.

¡Felicitaciones!

Consultaste un conjunto de datos públicos, creaste una tabla personalizada, cargaste datos y ejecutaste una consulta en ella.

Finalice su lab

Cuando haya completado el lab, haga clic en Finalizar lab. Google Cloud Skills Boost quitará los recursos que usó y limpiará la cuenta.

Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.

La cantidad de estrellas indica lo siguiente:

  • 1 estrella = Muy insatisfecho
  • 2 estrellas = Insatisfecho
  • 3 estrellas = Neutral
  • 4 estrellas = Satisfecho
  • 5 estrellas = Muy satisfecho

Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.

Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.

Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Antes de comenzar

  1. Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
  2. .
  3. Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
  4. En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar

Usa la navegación privada

  1. Copia el nombre de usuario y la contraseña proporcionados para el lab
  2. Haz clic en Abrir la consola en modo privado

Accede a la consola

  1. Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
  2. Acepta las condiciones y omite la página de recursos de recuperación
  3. No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible

Un lab a la vez

Confirma para finalizar todos los labs existentes y comenzar este

Usa la navegación privada para ejecutar el lab

Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.