Vertex AI is now Gemini Enterprise Agent Platform! We are currently updating our content to reflect this change. Please bear with us if you encounter naming inconsistencies during this transition.
Aplica tus habilidades en la consola de Google Cloud
Instrucciones y requisitos de configuración del lab
Protege tu cuenta y tu progreso. Usa siempre una ventana de navegador privada y las credenciales del lab para ejecutarlo.
De datos a estadísticas: Unión y combinación de conjuntos de datos v1.1
Lab
1 hora
universal_currency_alt
5 créditos
show_chart
Introductorio
info
Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Este contenido aún no está optimizado para dispositivos móviles.
Para obtener la mejor experiencia, visítanos en una computadora de escritorio con un vínculo que te enviaremos por correo electrónico.
Descripción general
JOIN enriquece tu conjunto de datos con su potencial de agregar campos (horizontalmente).
UNION adjunta más datos a tu tabla (verticalmente). Cuando comprendas las relaciones entre tus tablas, usa UNION para adjuntar registros a una tabla consolidada y JOIN para enriquecer los resultados con datos de varias fuentes.
En este lab, se describe cómo crear nuevas tablas de informes con uniones (JOIN) y combinaciones (UNION) de SQL.
Objetivos
En este lab, aprenderás a realizar las siguientes tareas:
Describir la unión y combinación de conjuntos de datos
Describir la unión de tablas
Describir el trabajo con valores NULL
Configuración y requisitos
En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.
Accede a Qwiklabs desde una ventana de incógnito.
Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.
Cuando esté listo, haga clic en Comenzar lab.
Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.
Haga clic en Abrir Google Console.
Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
Si usa otras credenciales, se generarán errores o incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación.
Tarea 1. Practica la unión y la combinación de conjuntos de datos
Abra BigQuery en Console
En la consola de Google Cloud, seleccione elmenú de navegación > BigQuery.
Se abrirá el cuadro de mensaje Te damos la bienvenida a BigQuery en la consola de Cloud, Contiene un vínculo a la guía de inicio rápido y enumera las actualizaciones de la IU.
Haga clic en Listo.
Redacta la consulta en el EDITOR de BigQuery.
Asegúrate de que #standardSQL esté establecida como tu primera línea de código.
Escribe una consulta que registre la cantidad de declaraciones de impuestos por año calendario para todas las declaraciones del formulario 990 del IRS.
Utiliza la siguiente consulta escrita parcialmente para guiarte.
Pista: Deberás usar comodines de tablas * con _TABLE_SUFFIX.
#standardSQL
# UNION Wildcard and returning a table suffix
SELECT
COUNT(*) as number_of_filings,
AS year_filed
FROM `bigquery-public-data.irs_990.irs_990`
GROUP BY year_filed
ORDER BY year_filed DESC
Compara con la siguiente solución:
#standardSQL
# UNION Wildcard and returning a table suffix
SELECT
COUNT(*) as number_of_filings,
_TABLE_SUFFIX AS year_filed
FROM `bigquery-public-data.irs_990.irs_990_*`
GROUP BY year_filed
ORDER BY year_filed DESC
Ejecuta la consulta y confírmala con los resultados que se muestran a continuación.
Resultado:
Modifica la consulta que acabas de escribir para incluir solo las tablas IRS con el siguiente formato: irs_990_YYYY (es decir, filtra pf, ez y ein). Comienza con la consulta completada parcialmente que figura a continuación:
#standardSQL
# UNION Wildcard and returning a table suffix
SELECT
COUNT(*) as number_of_filings,
CONCAT(,_TABLE_SUFFIX) AS year_filed
FROM `bigquery-public-data.irs_990.irs_990_*`
GROUP BY year_filed
ORDER BY year_filed DESC
Compara con la siguiente solución:
#standardSQL
# UNION Wildcard and returning a table suffix
SELECT
COUNT(*) as number_of_filings,
CONCAT("2",_TABLE_SUFFIX) AS year_filed
FROM `bigquery-public-data.irs_990.irs_990_2*`
GROUP BY year_filed
ORDER BY year_filed DESC
Ejecuta la consulta y confirma el resultado:
Por último, modifica la consulta para que solo incluya las declaraciones de impuestos de las tablas de 2013 o posteriores. Además, incluye los promedios totrevenue y totfuncexpns como métricas adicionales.
Pista: Considera utilizar _TABLE_SUFFIX en un filtro.
Compara con la siguiente solución:
#standardSQL
# count of filings, revenue, expenses since 2013
SELECT
CONCAT("20",_TABLE_SUFFIX) AS year_filed,
COUNT(ein) AS nonprofit_count,
AVG(totrevenue) AS avg_revenue,
AVG(totfuncexpns) AS avg_expenses
FROM `bigquery-public-data.irs_990.irs_990_20*`
WHERE _TABLE_SUFFIX >= '13'
GROUP BY year_filed
ORDER BY year_filed DESC
Ejecuta la consulta y confirma el resultado:
Tarea 2. Practica uniendo tablas
Encuentra los nombres de la organización de todos los EIN de 2015 con algunos ingresos o gastos. Deberás unir los datos de la tabla de declaración de impuestos con la tabla de detalles de la organización.
Comienza con la siguiente consulta y completa las tablas, la condición de unión y cualquier filtro que necesites:
#standard SQL
# Find the Org Names of all EINs for 2015 with some revenue or expenses, limit 100
SELECT
tax.ein AS tax_ein,
org.ein AS org_ein,
org.name,
tax.totrevenue,
tax.totfuncexpns
FROM
AS tax
JOIN
AS org
ON
tax.ein =
WHERE
> 0
LIMIT
100;
Compara tu consulta con la siguiente solución:
#standardSQL
# Find the Org Names of all EINs for 2015 with some revenue or expenses, limit 100
SELECT
tax.ein AS tax_ein,
org.ein AS org_ein,
org.name,
tax.totrevenue,
tax.totfuncexpns
FROM
`bigquery-public-data.irs_990.irs_990_2015` AS tax
JOIN
`bigquery-public-data.irs_990.irs_990_ein` AS org
ON
tax.ein = org.ein
WHERE
tax.totrevenue + tax.totfuncexpns > 0
LIMIT
100;
Ejecuta la consulta.
Confirma que los resultados muestran 100 registros, los nombres de la organización y al menos algunos gastos o ingresos.
Borra los datos del EDITOR de BigQuery.
Tarea 3. Practica trabajando con valores NULL
Escribe una consulta para encontrar dónde existen registros de impuestos para 2015, pero sin el nombre de la organización correspondiente.
Completa la consulta inicial parcialmente escrita que aparece a continuación:
#standardSQL
# Find where tax records exist for 2015 but no corresponding Org Name
SELECT
tax.ein AS tax_ein,
org.ein AS org_ein,
org.name,
tax.totrevenue,
tax.totfuncexpns
FROM
`bigquery-public-data.irs_990.irs_990_2015` tax
FULL # Complete the JOIN
`bigquery-public-data.irs_990.irs_990_ein` org
ON
WHERE
IS NULL # put tax.ein or org.ein to check here (one is correct)
Compara tu solución con la siguiente:
#standardSQL
# Find where tax records exist for 2015 but no corresponding Org Name
SELECT
tax.ein AS tax_ein,
org.ein AS org_ein,
org.name,
tax.totrevenue,
tax.totfuncexpns
FROM
`bigquery-public-data.irs_990.irs_990_2015` tax
FULL JOIN
`bigquery-public-data.irs_990.irs_990_ein` org
ON
tax.ein = org.ein
WHERE
org.ein IS NULL
Ejecuta la consulta.
Pregunta: ¿Cuántas declaraciones de impuestos se realizaron en 2015, pero no tienen el registro correspondiente en la tabla de detalles de la organización?
Respuesta: 14,123 (es posible que tu respuesta sea mayor a medida que se vayan agregando nuevos números EIN a la tabla de base pública)
¡Felicitaciones!
Completaste el lab UNIÓN y COMBINACIÓN de conjuntos de datos.
Revisión de lo aprendido
Utiliza UNION Wildard para tratar varias tablas como un solo grupo.
Utiliza _TABLE_SUFFIX para filtrar tablas comodín y crear campos calculados con el nombre de la tabla.
Los FULL JOIN (también llamados FULL OUTER JOIN) incluyen todos los registros de cada tabla unida independientemente de si hay coincidencias en la clave de unión.
Si las claves de unión no son únicas, puede producirse una UNIÓN CRUZADA involuntaria (más filas de salida que de entrada), lo que debe evitarse.
Usa COUNT() y GROUP BY para determinar si un campo clave es realmente único.
Finalice su lab
Cuando haya completado el lab, haga clic en Finalizar lab. Google Cloud Skills Boost quitará los recursos que usó y limpiará la cuenta.
Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.
La cantidad de estrellas indica lo siguiente:
1 estrella = Muy insatisfecho
2 estrellas = Insatisfecho
3 estrellas = Neutral
4 estrellas = Satisfecho
5 estrellas = Muy satisfecho
Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.
Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.
Copyright 2026 Google LLC. Todos los derechos reservados. Google y el logotipo de Google son marcas de Google LLC. El resto de los nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que están asociados.
Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
.
Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar
Usa la navegación privada
Copia el nombre de usuario y la contraseña proporcionados para el lab
Haz clic en Abrir la consola en modo privado
Accede a la consola
Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación
No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
Un lab a la vez
Confirma para finalizar todos los labs existentes y comenzar este
Usa la navegación privada para ejecutar el lab
Usar una ventana de incógnito o de navegación privada es la mejor forma de ejecutar
este lab. Así evitarás cualquier conflicto entre tu cuenta personal
y la cuenta de estudiante, lo que podría generar cargos adicionales en
tu cuenta personal.
UNIÓN y COMBINACIÓN de conjuntos de datos
Duración:
0 min de configuración
·
Acceso por 60 min
·
60 min para completar