GSP1345
Descripción general
Imagina que te dedicas a la ingeniería de datos en Cymbal Gaming. Tú y el equipo de desarrollo están creando un nuevo juego de eSports, "Galactic Grand Prix", que genera datos en tiempo real de partidas entre dos jugadores de diferentes equipos. Por ejemplo, dos jugadores compiten en un evento, se determina un ganador y se otorgan puntos al jugador y al equipo ganadores. Se te asignó la tarea de crear recomendaciones basadas en los datos de compra de contenido descargable (DLC). Si un jugador compra DLC para su personaje de Galactic Grand Prix, le ofrecerás otros artículos en función de lo que compren otros competidores.
Leíste sobre Pub/Sub y sabes que se puede usar con datos de transmisión en Google Cloud. También leíste sobre Dataflow (el servicio administrado de Apache Beam de Google Cloud) y Bigtable, una base de datos NoSQL en Google Cloud. Sospechas que estos servicios se pueden usar con notebooks de Jupyter para crear una solución que ofrezca otros elementos de DLC a los clientes en función de sus compras, pero no sabes por dónde empezar.
Cuando inicies el lab, el entorno contendrá los recursos que se muestran en el siguiente diagrama.
Al final del lab, habrás usado la arquitectura para realizar varias tareas.
En la siguiente tabla, se proporciona una explicación detallada de cada tarea en relación con la arquitectura del lab.
| Número de tarea |
Detalle |
| 1. |
Crea recursos de Google Cloud: En esta tarea, crearás el tema y la suscripción de Pub/Sub, así como la instancia de Bigtable. Crearás la tabla más adelante en el notebook. |
| 2. |
Abre el notebook en Vertex AI Workbench y elige el kernel. |
| 3. |
Instala paquetes y configura el notebook para tu proyecto: En esta lab, usarás las diversas bibliotecas de Python, incluidas PyTorch (como el modelo para tensores) y Apache Beam (para admitir la integración de Dataflow). Estas bibliotecas se instalarán una vez que se aprovisione tu lab y te referirás a ellas en el notebook de Jupyter a lo largo del lab. También debes configurar el notebook para que tenga acceso a los recursos de tu proyecto, como el bucket de Cloud Storage que se te proporcionó cuando iniciaste el lab. |
| 4. |
Entrena el modelo: En esta tarea, entrenarás el modelo de PyTorch con datos de compra de jugadores de Galactic Grand Prix para productos DLC, como tensores. |
| 5. |
Configura la tabla de Bigtable y publica mensajes en Pub/Sub: En esta tarea, configurarás la tabla de Bigtable en tu instancia y publicarás mensajes en tu suscripción de Pub/Sub. |
| 6. |
Usa el controlador de enriquecimiento y la transformación de Bigtable: En esta tarea, utilizarás el controlador de enriquecimiento y la transformación de Bigtable. |
| 7. |
Ejecuta la inferencia y la canalización: En esta tarea, usarás la interfaz PyTorchModelHandlerTensor para ejecutar la inferencia y, luego, la canalización. |
Objetivos
En este lab, aprenderás a hacer lo siguiente:
- Entrenar un modelo de PyTorch con datos de compra representados como tensores
- Enriquecer las nuevas compras de Pub/Sub con datos demográficos
- Recomendar productos a clientes nuevos con una canalización de Dataflow
Configuración y requisitos
Antes de hacer clic en el botón Comenzar lab
Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
- Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.
Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
- Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).
Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.
Cómo iniciar tu lab y acceder a la consola de Google Cloud
-
Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá un diálogo para que selecciones la forma de pago.
A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
- El botón para abrir la consola de Google Cloud
- El tiempo restante
- Las credenciales temporales que debes usar para el lab
- Otra información para completar el lab, si es necesaria
-
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordena las pestañas en ventanas separadas, una junto a la otra.
Nota: Si ves el diálogo Elegir una cuenta, haz clic en Usar otra cuenta.
-
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
{{{user_0.username | "Username"}}}
También puedes encontrar el nombre de usuario en el panel Detalles del lab.
-
Haz clic en Siguiente.
-
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
{{{user_0.password | "Password"}}}
También puedes encontrar la contraseña en el panel Detalles del lab.
-
Haz clic en Siguiente.
Importante: Debes usar las credenciales que te proporciona el lab. No uses las credenciales de tu cuenta de Google Cloud.
Nota: Usar tu propia cuenta de Google Cloud para este lab podría generar cargos adicionales.
-
Haz clic para avanzar por las páginas siguientes:
- Acepta los Términos y Condiciones.
- No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
- No te registres para obtener pruebas gratuitas.
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
Nota: Para acceder a los productos y servicios de Google Cloud, haz clic en el menú de navegación o escribe el nombre del servicio o producto en el campo Buscar.
Tarea 1: Crea los recursos de Google Cloud
En esta tarea, crearás los recursos de Google Cloud que respaldan el lab, incluidos el tema y la suscripción de Pub/Sub, y la instancia de Bigtable. Nota: Usarás comandos de Cloud Shell para crear estos recursos y acelerar el proceso.
Para utilizar los comandos de gcloud CLI de manera eficaz, primero accede a Google Cloud Shell y establece variables de entorno.
Accede a Cloud Shell y configura variables de entorno
-
Para abrir Cloud Shell, haz clic en Activar Google Cloud Shell.
-
Debes autorizar su uso, ya que es la primera vez que usas Cloud Shell en este lab. Para ello, haz clic en Continue y, luego, en Authorize en la ventana emergente.
-
Ejecuta los siguientes comandos.
export PROJECT_ID="{{{project_0.project_id|set at lab start}}}"
-
Ejecuta los comandos que se indican a continuación para confirmar que las variables estén almacenadas.
echo ${PROJECT_ID}
Usarás estas variables más adelante en el lab.
Crea la instancia de Bigtable
-
Ejecuta el siguiente comando para crear la instancia de Bigtable.
gcloud bigtable instances create instance \
--display-name="My Bigtable Instance" \
--cluster-config=id=my-cluster,zone={{{project_0.default_zone | Zone}}},nodes=1
Deberías ver un mensaje de confirmación que indica que se creó la instancia.
Nota: Crearás la tabla de Bigtable más adelante en tu notebook de Jupyter.
Crea el tema y la suscripción de Pub/Sub
-
Ejecuta el siguiente comando para crear el tema de Pub/Sub.
gcloud pubsub topics create customer-data
Deberías ver un mensaje de confirmación que indica que se creó el tema de Pub/Sub.
-
Ejecuta el siguiente comando para crear la suscripción de Pub/Sub para tu tema.
gcloud pubsub subscriptions create customer-data_sub --topic=customer-data
Deberías ver un mensaje de confirmación que indica que la suscripción se agregó al tema.
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear los recursos de Google Cloud
Tarea 2: Abre el notebook en Vertex AI Workbench y elige el kernel
Tarea 2a: Abre el notebook
-
En el menú de navegación (
) de la consola de Google Cloud, haz clic en Vertex AI > Workbench.
-
Busca la instancia y haz clic en el botón Abrir JupyterLab.
La interfaz de JupyterLab para tu instancia de Workbench se abrirá en una pestaña nueva del navegador.
Nota: Si no ves notebooks en JupyterLab, sigue estos pasos adicionales para restablecer la instancia:
1. Cierra la pestaña del navegador de JupyterLab y vuelve a la página principal de Workbench.
2. Selecciona la casilla de verificación junto al nombre de la instancia y haz clic en Restablecer.
3. Después de que se vuelva a habilitar el botón Abrir JupyterLab, espera un minuto y, luego, haz clic en Abrir JupyterLab.
Tarea 2b: Elige el kernel
-
Abre el archivo .
-
En el diálogo Select Kernel, elige Python 3 en la lista de kernels disponibles.
Tarea 3: Importa paquetes de Python y establece variables de entorno
En esta tarea, importarás los paquetes de Python necesarios para usar este notebook y, luego, establecerás variables de entorno.
-
Completa los pasos de la tarea 3 en la sección del notebook para instalar los paquetes y configurar el notebook.
Para Project ID, usa ; para instance_id, usa instance, y para table_id, usa customer_data. Recuerda que creaste la instancia de Bigtable en la tarea 1. Si estableces estos valores ahora, te asegurarás de completar correctamente las tareas posteriores en este notebook. De lo contrario, es posible que se produzcan errores.
Haz clic en Revisar mi progreso para verificar el objetivo.
Instalar paquetes y configurar el notebook
Tarea 4: Entrena el modelo
En esta tarea, crearás el conjunto de datos y convertirás los datos en tensores. Luego, crearás el modelo de PyTorch y lo entrenarás con esos tensores.
- Completa la sección sobre entrenar el modelo del notebook.
Haz clic en Revisar mi progreso para verificar el objetivo.
Entrenar el modelo
Tarea 5: Configura la tabla de Bigtable y publica mensajes en Pub/Sub
En esta tarea, crearás y configurarás la tabla de Bigtable con las familias de columnas y, luego, cargarás datos en la tabla. También publicarás mensajes en Pub/Sub.
- Revisa la sección sobre configurar la tabla de Bigtable y publicar mensajes en Pub/Sub del notebook.
Haz clic en Revisar mi progreso para verificar el objetivo.
Configurar la tabla de Bigtable y publicar mensajes en Pub/Sub
Tarea 6: Usa el controlador de enriquecimiento y la transformación de Bigtable
En esta tarea, usarás el controlador de enriquecimiento de Bigtable, un conector especializado que se usa en tu canalización de Dataflow, que realiza el proceso de enriquecimiento con Bigtable como fuente de datos. También usarás la transformación de enriquecimiento de Bigtable. Piensa en el controlador de enriquecimiento de Bigtable como la herramienta y en la transformación como el verbo que lo inicia en tu código.
- Revisa la sección sobre usar el controlador de enriquecimiento y la transformación de Bigtable del notebook.
Haz clic en Revisar mi progreso para verificar el objetivo.
Usar el controlador de enriquecimiento y la transformación de Bigtable
Tarea 7: Ejecuta la inferencia y la canalización
En esta tarea, ejecutarás la inferencia con el modelo de PyTorch y la canalización de Dataflow.
- Revisa la sección sobre ejecutar la inferencia y la canalización del notebook.
Importante: Una vez que obtengas las tres recomendaciones proporcionadas por la canalización en la última celda, como se indica en el notebook, la celda seguirá ejecutándose. Debes detenerla de forma manual. Si no lo haces, la canalización se detendrá automáticamente cuando se agote el tiempo de espera del entorno del lab.
Haz clic en Revisar mi progreso para verificar el objetivo.
Ejecutar la inferencia y la canalización
¡Felicitaciones!
En este lab, aprendiste a entrenar un modelo de PyTorch con datos de compra representados como tensores. También aprendiste a enriquecer las nuevas compras de Pub/Sub con datos demográficos y, luego, a recomendar nuevos productos de DLC a los clientes con tu canalización de Dataflow.
Capacitación y certificación de Google Cloud
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Última actualización del manual: 22 de enero de 2026
Prueba más reciente del lab: 22 de enero de 2026
Copyright 2026 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.