GSP1054

Descripción general
Bigtable es el servicio de base de datos NoSQL escalable y completamente administrado de Google. Bigtable es ideal para almacenar grandes cantidades de datos en un almacén de pares clave-valor y para casos de uso como personalización, tecnología publicitaria, tecnología financiera, medios digitales y el Internet de las cosas (IoT). Bigtable admite una alta capacidad de procesamiento de lectura y escritura con una latencia baja, lo que brinda acceso rápido a grandes cantidades de datos para su procesamiento y análisis.
Para los casos de uso de personalización, Bigtable puede manejar tanto escrituras altas para almacenar las interacciones de los usuarios con productos en línea como lecturas altas para proporcionar estas interacciones a los modelos que producen recomendaciones personalizadas.
En este lab, usarás la consola de Google Cloud para crear una instancia de Bigtable con una tabla para almacenar las interacciones de los usuarios con los productos. Luego, usas una plantilla de Dataflow para completar la tabla con archivos de datos generados previamente en Cloud Storage. Una vez que el trabajo de Dataflow finaliza, verificas que la tabla se haya completado correctamente con los datos y, luego, completas el lab borrando los datos de Bigtable.
Actividades
En este lab, aprenderás a crear una instancia de Bigtable y cargar datos desde Cloud Storage sin escribir nada de código.
- Crea una instancia de Bigtable y una tabla de Bigtable con familias de columnas.
- Usa una plantilla de Dataflow para cargar archivos SequenceFile de Cloud Storage en Bigtable.
- Verifica los datos cargados en Bigtable.
- Borra la tabla y la instancia de Bigtable.
Requisitos previos
Configuración y requisitos
Antes de hacer clic en el botón Comenzar lab
Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
- Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.
Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
- Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).
Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.
Cómo iniciar tu lab y acceder a la consola de Google Cloud
-
Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá un diálogo para que selecciones la forma de pago.
A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
- El botón para abrir la consola de Google Cloud
- El tiempo restante
- Las credenciales temporales que debes usar para el lab
- Otra información para completar el lab, si es necesaria
-
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordena las pestañas en ventanas separadas, una junto a la otra.
Nota: Si ves el diálogo Elegir una cuenta, haz clic en Usar otra cuenta.
-
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
{{{user_0.username | "Username"}}}
También puedes encontrar el nombre de usuario en el panel Detalles del lab.
-
Haz clic en Siguiente.
-
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
{{{user_0.password | "Password"}}}
También puedes encontrar la contraseña en el panel Detalles del lab.
-
Haz clic en Siguiente.
Importante: Debes usar las credenciales que te proporciona el lab. No uses las credenciales de tu cuenta de Google Cloud.
Nota: Usar tu propia cuenta de Google Cloud para este lab podría generar cargos adicionales.
-
Haz clic para avanzar por las páginas siguientes:
- Acepta los Términos y Condiciones.
- No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
- No te registres para obtener pruebas gratuitas.
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
Nota: Para acceder a los productos y servicios de Google Cloud, haz clic en el menú de navegación o escribe el nombre del servicio o producto en el campo Buscar.
Activa Cloud Shell
Cloud Shell es una máquina virtual que cuenta con herramientas para desarrolladores. Ofrece un directorio principal persistente de 5 GB y se ejecuta en Google Cloud. Cloud Shell proporciona acceso de línea de comandos a tus recursos de Google Cloud.
-
Haz clic en Activar Cloud Shell
en la parte superior de la consola de Google Cloud.
-
Haz clic para avanzar por las siguientes ventanas:
- Continúa en la ventana de información de Cloud Shell.
- Autoriza a Cloud Shell para que use tus credenciales para realizar llamadas a la API de Google Cloud.
Cuando te conectes, habrás completado la autenticación, y el proyecto estará configurado con tu Project_ID, . El resultado contiene una línea que declara el Project_ID para esta sesión:
Your Cloud Platform project in this session is set to {{{project_0.project_id | "PROJECT_ID"}}}
gcloud es la herramienta de línea de comandos de Google Cloud. Viene preinstalada en Cloud Shell y es compatible con la función de autocompletado con tabulador.
- Puedes solicitar el nombre de la cuenta activa con este comando (opcional):
gcloud auth list
- Haz clic en Autorizar.
Resultado:
ACTIVE: *
ACCOUNT: {{{user_0.username | "ACCOUNT"}}}
To set the active account, run:
$ gcloud config set account `ACCOUNT`
- Puedes solicitar el ID del proyecto con este comando (opcional):
gcloud config list project
Resultado:
[core]
project = {{{project_0.project_id | "PROJECT_ID"}}}
Nota: Para obtener toda la documentación de gcloud, en Google Cloud, consulta la guía con la descripción general de gcloud CLI.
API de Dataflow
Asegúrate de que la API de Dataflow esté habilitada correctamente
Para garantizar el acceso a la API necesaria, reinicia la conexión a la API de Dataflow.
gcloud services disable dataflow.googleapis.com --project {{{project_0.project_id|Project ID}}} --force
gcloud services enable dataflow.googleapis.com --project {{{project_0.project_id|Project ID}}}
Haz clic en Revisar mi progreso para verificar el objetivo.
API de Dataflow
Tarea 1: Crea una instancia de Bigtable
Para crear una tabla nueva en Bigtable, primero debes crear una instancia de Bigtable en la que se almacenará tu tabla.
-
En el menú de navegación (
) de la consola de Google Cloud, en Bases de datos, haz clic en Bigtable.
-
Haz clic en Crear instancia.
-
Ingresa la información necesaria para crear una instancia de Bigtable:
| Propiedad |
Valor |
| Nombre de la instancia |
Personalized Sales |
| ID de instancia |
Conserva el valor predeterminado |
| Tipo de almacenamiento |
SSD |
| ID del clúster |
Conserva el valor predeterminado |
| Región |
|
| Zona |
|
| Modo de escalamiento de nodos |
Asignación manual |
| Cantidad |
Conserva el valor predeterminado |
- Haz clic en Crear.
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear una instancia de Bigtable
Tarea 2: Crea una tabla de Bigtable
En Bigtable, cada fila de una tabla tiene un identificador único llamado clave de fila, y las columnas de una tabla se agrupan por familia de columnas para organizar las columnas relacionadas. En esta tarea, crearás una tabla de Bigtable con claves de fila y familias de columnas adecuadas para las interacciones de los usuarios.
Primero, crearás una tabla llamada UserSessions para almacenar las interacciones en línea de los usuarios con varios productos y las ventas confirmadas, usando el ID de usuario combinado con la marca de tiempo como clave de fila. Luego, crearás dos familias de columnas llamadas Interactions y Sales para ayudar a organizar las columnas relacionadas.
-
En la lista de instancias de Bigtable, haz clic en el ID de instancia llamado personalized-sales.
-
En el menú de navegación, en Instancia, haz clic en Tablas.
-
Haz clic en Crear tabla.
-
En ID de la tabla, escribe UserSessions.
-
Haz clic en Agregar familia de columnas.
-
En Nombre de la familia de columnas, escribe Interactions.
Deja el valor predeterminado para la política de recolección de elementos no utilizados.
-
Haz clic en Listo.
-
Repite los pasos del 5 al 7 para crear otra familia de columnas llamada Sales.
-
Haz clic en Crear.
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear una tabla de Bigtable
Tarea 3: Carga archivos de datos desde Cloud Storage con una plantilla de Dataflow
En esta tarea, ejecutarás un trabajo de Dataflow para cargar datos de Cloud Storage a Bigtable. Para ejecutar el trabajo de Dataflow correctamente, primero deberás crear un bucket de Cloud Storage para que Dataflow escriba los archivos temporales según sea necesario. Luego, podrás crear y ejecutar correctamente un nuevo trabajo de Dataflow a partir de una plantilla.
Crea un bucket de Cloud Storage
-
En el menú de navegación (
) de la consola de Google Cloud, haz clic en Vista general de Cloud > Panel.
-
En Información del proyecto, copia el valor de ID del proyecto (como ).
Usarás tu ID del proyecto de Qwiklabs, que ya es único a nivel global, como el nombre del bucket de Cloud Storage.
-
En el menú de navegación (
) de la consola de Google Cloud, haz clic en Cloud Storage > Buckets.
-
Haz clic en Crear bucket.
-
Ingresa la información requerida para crear un bucket de Cloud Storage y reemplaza project-id por el ID del proyecto que copiaste en el paso 2.
| Propiedad |
Valor |
| Nombre |
project-id |
| Tipo de ubicación |
Multirregional |
| Ubicación |
us (múltiples regiones en Estados Unidos) |
Deja los valores predeterminados en los otros parámetros.
-
Haz clic en Crear.
-
Si aparece el mensaje Se impedirá el acceso público, haz clic en Confirmar.
Crea un trabajo de Dataflow con una plantilla
-
En el menú de navegación (
) la consola de Google Cloud, en Análisis, haz clic en Dataflow > Trabajos.
-
Haz clic en Crear trabajo a partir de una plantilla.
-
Ingresa la información requerida para crear un trabajo de Dataflow a partir de una plantilla y reemplaza project-id por el ID del proyecto que copiaste anteriormente.
| Propiedad |
Valor |
| Nombre del trabajo |
import-usersessions |
| Extremo regional |
|
| Plantilla de Dataflow |
Archivos SequenceFile en Cloud Storage a Cloud Bigtable |
| ID del proyecto |
project-id |
| ID de instancia |
personalized-sales |
| ID de la tabla |
UserSessions |
| Patrón de ruta de acceso de origen |
gs://spls/gsp1054/retail-interactions-sales-00000-of-00001 |
| Ubicación temporal |
gs://project-id/temp |
Deja los valores predeterminados en los otros parámetros.
-
Haz clic en Ejecutar trabajo.
-
En la sección Vista de los pasos del trabajo de la página Gráfico del trabajo, selecciona Vista de gráfico.
En la Vista de gráfico, se muestra el avance del trabajo en los siguientes pasos:
- Leer los SequenceFiles en Cloud Storage
- Mutar los datos para cargarlos en Bigtable
- Escribir los datos en Bigtable
- Para ver una vista de tabla de los mismos pasos, selecciona Vista de tabla.
Cuando el trabajo se completa correctamente, se muestra una marca de verificación verde, que simboliza el estado Sin errores, junto a cada tarea en el gráfico de trabajo. Este trabajo tardará alrededor de 3 a 5 minutos en ejecutarse correctamente.
Haz clic en Revisar mi progreso para verificar el objetivo.
Cargar archivos de datos desde Cloud Storage con una plantilla de Dataflow
Tarea 4: Verifica los datos cargados en Bigtable
Después de que tu trabajo de Dataflow se complete correctamente, puedes usar los comandos de cbt (la herramienta de línea de comandos de Cloud Bigtable) para conectarte a tu instancia de Bigtable y verificar que los datos se hayan propagado en la tabla.
Configura la CLI de Bigtable
Para conectarte a Bigtable con los comandos de la CLI de cbt, primero debes actualizar el archivo de configuración .cbtrc con los IDs del proyecto y de la instancia de Bigtable con Cloud Shell.
Si necesitas un repaso de cómo acceder a Cloud Shell, haz clic en Configuración y requisitos en el menú del lado derecho de esta página.
- Para modificar el archivo
.cbtrc con los IDs del proyecto y de la instancia, ejecuta los siguientes comandos en Cloud Shell:
echo project = `gcloud config get-value project` \
>> ~/.cbtrc
echo instance = personalized-sales \
>> ~/.cbtrc
- Para verificar que modificaste correctamente el archivo
.cbtrc, ejecuta el siguiente comando:
cat ~/.cbtrc
El resultado debe parecerse al siguiente:
project = <project-id>
instance = personalized-sales
Consulta datos en la tabla
Después de configurar el archivo de configuración .cbtrc en Cloud Shell, puedes ejecutar un comando sencillo de la CLI de cbt para consultar los primeros diez registros de la tabla.
- Para ver los datos de las primeras diez filas de la tabla, ejecuta el siguiente comando:
cbt read UserSessions \
count=10
El resultado está estructurado de la siguiente manera:
----------------------------------------------
ROW KEY
COLUMN_FAMILY:COLUMN_QUALIFIER @ TIMESTAMP
VALUE
Los valores de salida se verán de la siguiente manera:
----------------------------------------------
blue1#1638940844409
Interactions:blue_blouse @ 2022/06/07-18:34:28.858000
"purchased"
Interactions:blue_jacket @ 2022/06/07-18:34:28.858000
"viewed details"
Interactions:blue_shoes @ 2022/06/07-18:34:28.858000
"viewed details"
Interactions:green_skirt @ 2022/06/07-18:34:28.858000
"seen"
Interactions:orange_dress @ 2022/06/07-18:34:28.858000
"seen"
Interactions:purple_dress @ 2022/06/07-18:34:28.858000
"seen"
Interactions:purple_skirt @ 2022/06/07-18:34:28.858000
"seen"
Interactions:user_id @ 2022/06/07-18:34:28.858000
"blue1"
Interactions:yellow_blouse @ 2022/06/07-18:34:28.858000
"seen"
Sales:sale @ 2022/06/07-18:34:28.858000
"blue_blouse"
Tarea 5: Borra una tabla y una instancia de Bigtable
-
En el menú de navegación (
) de la consola de Google Cloud, en Bases de datos, haz clic en Bigtable.
-
En la lista de instancias de Bigtable, haz clic en el ID de instancia llamado personalized-sales.
-
En el menú de navegación, en Instancia, haz clic en Tablas.
-
Haz clic en la tabla llamada UserSessions.
-
Haz clic en Borrar tabla.
-
En el diálogo de confirmación, escribe UserSessions.
-
Haz clic en Borrar.
-
En el menú de navegación, en Instancia, haz clic en Descripción general.
-
Haz clic en Borrar instancia.
-
En el diálogo de confirmación, escribe personalized-sales.
-
Haz clic en Borrar.
Haz clic en Revisar mi progreso para verificar el objetivo.
Borrar una tabla y una instancia de Bigtable
¡Felicitaciones!
En este lab, usaste Bigtable para crear una instancia y una tabla, cargaste datos en la tabla con una plantilla de Dataflow y confirmaste que los datos se cargaron correctamente ejecutando comandos sencillos de la CLI de cbt. Luego, completaste el lab borrando la tabla y la instancia de Bigtable.
Próximos pasos y más información
Capacitación y certificación de Google Cloud
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Última actualización del manual: 13 de agosto de 2025
Prueba más reciente del lab: 13 de agosto de 2025
Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.