Obtén acceso a más de 700 labs y cursos

Data Catalog: Qwik Start

Lab 30 minutos universal_currency_alt 1 crédito show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Obtén acceso a más de 700 labs y cursos

Data Catalog dejó de estar disponible y se descontinuará el 30 de enero de 2026. Si lo deseas, igual puedes completar este lab.

Para conocer los pasos para migrar los usuarios, las cargas de trabajo y el contenido de Data Catalog a Dataplex Universal Catalog, consulta la documentación titulada Transición de Data Catalog a Dataplex Catalog.

GSP729

Logotipo de los labs de autoaprendizaje de Google Cloud

Descripción general

Data Catalog es un servicio de administración de metadatos escalable y completamente administrado dentro de Dataplex.

Ofrece una interfaz de búsqueda simple y fácil de usar para el descubrimiento de datos y un sistema de categorización flexible y potente que se usa para capturar metadatos técnicos y empresariales. Además, brinda una base sólida de seguridad y cumplimiento gracias a las integraciones con Cloud Data Loss Prevention (DLP) y Cloud Identity and Access Management (IAM).

BigQuery es un almacén de datos para empresas que permite realizar consultas en SQL superrápidas gracias a la potencia de procesamiento de la infraestructura de Google.

Simplemente traslada tus datos a BigQuery y déjanos el trabajo duro a nosotros. Puedes controlar el acceso al proyecto y a tus datos (por ejemplo, puedes otorgar permisos de visualización o consulta de datos) según tus necesidades empresariales.

Cómo usar Data Catalog

Existen dos formas principales de interactuar con Data Catalog:

  • Buscar recursos de datos a los que tienes acceso
  • Etiquetar recursos con metadatos

Caso de uso de Data Catalog

Imagina que eres el ingeniero de datos de tu empresa. Tu trabajo es garantizar que tus colegas, como los científicos de datos o los analistas de negocios, puedan descubrir y usar fácilmente todos los conjuntos de datos. Cuando ingresa un conjunto de datos nuevo, tú realizas anotaciones con información importante, por ejemplo, si contiene datos de identificación personal o no, quién es el propietario del conjunto de datos, cuántas filas tiene, etcétera.

Puedes anotar esta información agregando etiquetas a tus conjuntos de datos y tablas. Data Catalog te permite crear plantillas de etiqueta para que definas qué tipo de atributos deseas etiquetar. Esto te permite acceder, asociar y descubrir fácilmente la información pertinente de tus conjuntos de datos y tablas.

Qué aprenderás

En este lab, aprenderás a realizar las siguientes tareas:

  • Habilitar la API de Data Catalog para usar este servicio en tu proyecto de Google Cloud
  • Crear un conjunto de datos con BigQuery
  • Copiar una tabla pública de taxis de Nueva York en tu conjunto de datos
  • Crear una plantilla de etiqueta de Data Catalog
  • Etiquetar tu tabla recién creada con las etiquetas nuevas que creaste

Requisitos previos

Nota: Antes de comenzar este lab, sal de tu cuenta de Gmail personal o corporativa, o bien ejecuta este lab en modo Incógnito.

De este modo, evitarás la confusión de accesos mientras se ejecuta el lab.

Configuración y requisitos

Antes de hacer clic en el botón Comenzar lab

Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.

Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.

Para completar este lab, necesitarás lo siguiente:

  • Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.
Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
  • Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).
Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.

Cómo iniciar tu lab y acceder a la consola de Google Cloud

  1. Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá un diálogo para que selecciones la forma de pago. A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:

    • El botón para abrir la consola de Google Cloud
    • El tiempo restante
    • Las credenciales temporales que debes usar para el lab
    • Otra información para completar el lab, si es necesaria
  2. Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).

    El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.

    Sugerencia: Ordena las pestañas en ventanas separadas, una junto a la otra.

    Nota: Si ves el diálogo Elegir una cuenta, haz clic en Usar otra cuenta.
  3. De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.

    {{{user_0.username | "Username"}}}

    También puedes encontrar el nombre de usuario en el panel Detalles del lab.

  4. Haz clic en Siguiente.

  5. Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.

    {{{user_0.password | "Password"}}}

    También puedes encontrar la contraseña en el panel Detalles del lab.

  6. Haz clic en Siguiente.

    Importante: Debes usar las credenciales que te proporciona el lab. No uses las credenciales de tu cuenta de Google Cloud. Nota: Usar tu propia cuenta de Google Cloud para este lab podría generar cargos adicionales.
  7. Haz clic para avanzar por las páginas siguientes:

    • Acepta los Términos y Condiciones.
    • No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
    • No te registres para obtener pruebas gratuitas.

Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.

Nota: Para acceder a los productos y servicios de Google Cloud, haz clic en el menú de navegación o escribe el nombre del servicio o producto en el campo Buscar. Ícono del menú de navegación y campo de búsqueda

Activa Cloud Shell

Cloud Shell es una máquina virtual que cuenta con herramientas para desarrolladores. Ofrece un directorio principal persistente de 5 GB y se ejecuta en Google Cloud. Cloud Shell proporciona acceso de línea de comandos a tus recursos de Google Cloud.

  1. Haz clic en Activar Cloud Shell Ícono de Activar Cloud Shell en la parte superior de la consola de Google Cloud.

  2. Haz clic para avanzar por las siguientes ventanas:

    • Continúa en la ventana de información de Cloud Shell.
    • Autoriza a Cloud Shell para que use tus credenciales para realizar llamadas a la API de Google Cloud.

Cuando te conectes, habrás completado la autenticación, y el proyecto estará configurado con tu Project_ID, . El resultado contiene una línea que declara el Project_ID para esta sesión:

Your Cloud Platform project in this session is set to {{{project_0.project_id | "PROJECT_ID"}}}

gcloud es la herramienta de línea de comandos de Google Cloud. Viene preinstalada en Cloud Shell y es compatible con la función de autocompletado con tabulador.

  1. Puedes solicitar el nombre de la cuenta activa con este comando (opcional):
gcloud auth list
  1. Haz clic en Autorizar.

Resultado:

ACTIVE: * ACCOUNT: {{{user_0.username | "ACCOUNT"}}} To set the active account, run: $ gcloud config set account `ACCOUNT`
  1. Puedes solicitar el ID del proyecto con este comando (opcional):
gcloud config list project

Resultado:

[core] project = {{{project_0.project_id | "PROJECT_ID"}}} Nota: Para obtener toda la documentación de gcloud, en Google Cloud, consulta la guía con la descripción general de gcloud CLI.

Tarea 1: Habilita la API de Data Catalog

  1. En el menú de navegación, selecciona APIs y servicios > Biblioteca.

  2. En la barra de búsqueda, ingresa Data Catalog y selecciona API de Google Cloud Data Catalog.

  3. Haz clic en Habilitar.

Soluciona problemas de habilitación de la API

Si ves este error al intentar habilitar la API de Data Catalog, haz lo siguiente:

Mensaje de error No se pudo habilitar la API

  1. Haz clic en Cerrar.
  2. Actualiza la pestaña del navegador.
  3. Vuelve a hacer clic en Habilitar.

La API de Data Catalog debería habilitarse correctamente:

Ventana de Data Catalog de Google Cloud en la que se muestra una descripción general de la API de Data Catalog

Cómo abrir la consola de BigQuery

  1. En la consola de Google Cloud, selecciona el menú de navegación > BigQuery.

Se abrirá el cuadro de mensaje Te damos la bienvenida a BigQuery en la consola de Cloud. Este cuadro de mensaje contiene un vínculo a la guía de inicio rápido y las notas de la versión.

  1. Haz clic en Listo.

Se abrirá la consola de BigQuery.

Tarea 2: Crea un conjunto de datos

  1. En el panel de navegación izquierdo de BigQuery, haz clic en Ver acciones junto al ID del proyecto y, luego, haz clic en CREAR CONJUNTO DE DATOS.

El menú de navegación Ver acciones, en el que la opción Crear conjunto de datos está destacada dentro del menú secundario del proyecto.

  1. En el diálogo Crear conjunto de datos, haz lo siguiente:
  • En ID de conjunto de datos, ingresa demo_dataset.

  • Selecciona US (multiple regions in United States) en Ubicación de los datos.

La página Crear conjunto de datos, en la que se completan los campos ID del proyecto, ID del conjunto de datos y Ubicación de los datos.

  1. Luego, haz clic en Crear conjunto de datos.
Nota: No puedes agregar una descripción o una etiqueta cuando creas un conjunto de datos con la consola de Cloud. Podrás hacerlo después de crear el conjunto de datos.

Haz clic en Revisar mi progreso para verificar el objetivo. Crear un conjunto de datos

Tarea 3: Copia una tabla pública de taxis de Nueva York en tu conjunto de datos

  1. En el panel izquierdo, haz clic en + Agregar datos > Conjuntos de datos públicos.

  2. En la barra de búsqueda, ingresa NYC TLC Trips y haz clic en el resultado que aparece:

Los resultados de la búsqueda, en los que el mosaico NYC TLC Trips aparece destacado junto al menú "Filtrar por".

Para este lab, usarás una tabla de este conjunto de datos que contiene datos de viajes de los taxis amarillos de la ciudad de Nueva York del año 2018.

  1. Cuando esté todo listo para continuar, haz clic fuera del panel lateral para cerrarlo.

  2. Copia la tabla tlc_yellow_trips_2018. Para ello, ejecuta el siguiente comando en tu panel de Cloud Shell. Haz clic en Autorizar.

bq cp bigquery-public-data:new_york_taxi_trips.tlc_yellow_trips_2018 $(gcloud config get project):demo_dataset.trips

En el comando anterior, se utilizó bq command line tool para copiar la tabla pública en el proyecto y organizarla en el demo_dataset que creaste anteriormente.

  1. Actualiza tu página del navegador de BigQuery.

  2. Confirma que la tabla trips aparezca en demo_dataset.

Los proyectos fijados que figuran en la lista, en los que la tabla de viajes aparece como un archivo en demo_dataset.

Agregarás etiquetas de Data Catalog a la tabla en la siguiente sección.

Haz clic en Revisar mi progreso para verificar el objetivo. Copiar una tabla pública de taxis de Nueva York en tu conjunto de datos

Tarea 4: Crea una plantilla de etiqueta de Data Catalog

Crea una plantilla de etiqueta desde la IU de Data Catalog.

  1. En el menú de navegación (Menú de navegación) de la consola de Google Cloud, haz clic en Ver todos los productos. En Analytics, haz clic en Dataplex Universal Catalog.

  2. En el menú de la izquierda, en Administrar metadatos, haz clic en Catálogo.

  3. Haz clic en Crear plantilla de etiquetas (obsoleto).

  4. Cuando se te pregunte ¿Confirmas que quieres continuar?, haz clic en Continuar.

Nota: Las plantillas de etiquetas se reemplazarán por tipos de aspectos, pero aún son funcionales en este momento. Puedes continuar con los siguientes pasos para crear una plantilla de etiqueta.
  1. Completa el formulario de la plantilla para definir una “Plantilla de etiqueta de demostración”.
  • Nombre visible de la plantilla: Plantilla de etiqueta de demostración
  • ID de plantilla: demo_tag_template
  • Ubicación:

A continuación, crea cuatro atributos de etiqueta (también llamados "campos" de etiqueta).

  1. Haz clic en Agregar un campo.

Crea cuatro atributos con los valores que se indican a continuación. Ten en cuenta que el atributo "fuente" define un atributo de etiqueta requerido. Puedes usar letras minúsculas y guiones bajos para definir nombres de atributos:

  • Nombre visible del campo: Fuente del recurso de datos
  • ID del campo: source_of_data_asset
  • Hacer que este campo sea obligatorio: Opción marcada
  • Tipo: Cadena
  1. Haz clic en Listo.

  2. Ahora, haz clic en Agregar un campo y, luego, ingresa lo siguiente:

  • Nombre visible del campo: Cantidad de filas en el recurso de datos
  • ID del campo: number_of_rows_in_data_asset
  • Hacer que este campo sea obligatorio: Opción no marcada
  • Tipo: Doble
  1. Haz clic en Listo.

  2. Luego, haz clic en Agregar un campo y, a continuación, ingresa lo siguiente:

  • Nombre visible del campo: Contiene información de identificación personal
  • ID del campo: has_pii
  • Hacer que este campo sea obligatorio: Opción no marcada
  • Tipo: Booleano
  1. Haz clic en Listo.

  2. Luego, haz clic en Agregar un campo y, a continuación, ingresa lo siguiente:

  • Nombre visible del campo: Tipo de información de identificación personal
  • ID del campo: pii_type
  • Hacer que este campo sea obligatorio: Opción no marcada
  • Tipo: Enumerado
  1. Agrega 3 valores a este atributo:
  • Correo electrónico
  • Número de seguridad social
  • Ninguno
  1. Haz clic en Listo.

El formulario de plantilla de etiqueta que se completó debe incluir los cuatro atributos de etiqueta:

El formulario de plantilla de etiqueta que se completó, junto con las opciones de visibilidad y los botones Crear y Cancelar.

  1. Haz clic en CREAR.

En la página Plantilla de etiqueta de Data Catalog, se muestran los detalles y los atributos de la plantilla:

El catálogo de datos completo, que muestra los detalles de la plantilla, los campos, los nombres visibles y los tipos.

Haz clic en Revisar mi progreso para verificar el objetivo. Crear una plantilla de etiqueta

Tarea 5: Etiqueta tu tabla con las etiquetas recién creadas

  1. Para adjuntar una etiqueta a una tabla de tu conjunto de datos, haz clic en el ícono de Data Catalog en la esquina superior izquierda.

  2. En el panel izquierdo, selecciona Buscar y escribe demo_dataset en el cuadro de búsqueda.

  3. Haz clic en Buscar:

La página Data Catalog, con el término de búsqueda "demo_dataset" escrito en la barra de búsqueda.

El conjunto de datos demo_dataset y la tabla trips que copiaste en el conjunto de datos se muestran en los resultados de la búsqueda.

  1. Haz clic en el nombre de la tabla trips para abrirla:

demo_dataset que aparece en la lista junto con sus especificaciones y la tabla trips destacada.

Se abrirá la página Información de las entradas.

  1. Haz clic en ADJUNTAR ETIQUETAS.

La página Información de las entradas, en la que el botón Adjuntar etiquetas está destacado.

  1. Desde el cuadro de diálogo Adjuntar etiquetas, en "Elige qué etiquetar", selecciona la tabla trips y haz clic en Aceptar.

  2. Selecciona la Plantilla de etiqueta de demostración para etiquetar plantillas.

  3. Luego, ingresa o selecciona los siguientes valores para cada atributo de etiqueta:

  • source_of_data_asset: tlc_yellow_trips_2018
  • pii_type: NINGUNO

La página Adjuntar etiquetas, en la que la fuente de los recursos de datos y el tipo de información de identificación personal se seleccionaron y completaron en la Plantilla de etiqueta de demostración.

  1. Haz clic en Guardar.

  2. Haz clic en Plantilla de etiqueta de demostración para ver los atributos de etiqueta que aparecen en la página Información de las entradas.

La página Información de las entradas, que incluye el nombre visible de la Plantilla de etiqueta de demostración, la fuente del recurso de datos y el tipo de información de identificación personal.

Haz clic en Revisar mi progreso para verificar el objetivo. Adjuntar la etiqueta a tu tabla

¡Felicitaciones!

Buen trabajo. Aprendiste a crear correctamente una etiqueta y adjuntarla a una tabla con Data Catalog.

Próximos pasos y más información

Capacitación y certificación de Google Cloud

Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.

Última actualización del manual: 27 de mayo de 2025

Prueba más reciente del lab: 27 de mayo de 2025

Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Antes de comenzar

  1. Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
  2. .
  3. Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
  4. En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar

Usa la navegación privada

  1. Copia el nombre de usuario y la contraseña proporcionados para el lab
  2. Haz clic en Abrir la consola en modo privado

Accede a la consola

  1. Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
  2. Acepta las condiciones y omite la página de recursos de recuperación
  3. No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible

Un lab a la vez

Confirma para finalizar todos los labs existentes y comenzar este

Usa la navegación privada para ejecutar el lab

Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.