La biblioteca tf.Transform permite a los usuarios definir canalizaciones de procesamiento previo y ejecutarlas mediante frameworks de procesamiento de datos a gran escala y, al mismo tiempo, exportar las canalizaciones para ejecutarlas como parte de un grafo de TensorFlow.
Aprendizajes esperados
Procesar previamente los datos y realizar ingeniería de atributos nuevos con tf.Transform
Crear e implementar una canalización de Apache Beam
Usar los datos procesados para entrenar de manera local un modelo de tarifas de taxi y, luego, usarlo para realizar predicciones
Configuración
En cada lab, recibirá un proyecto de Google Cloud y un conjunto de recursos nuevos por tiempo limitado y sin costo adicional.
Accede a Qwiklabs desde una ventana de incógnito.
Ten en cuenta el tiempo de acceso del lab (por ejemplo, 1:15:00) y asegúrate de finalizarlo en el plazo asignado.
No existe una función de pausa. Si lo necesita, puede reiniciar el lab, pero deberá hacerlo desde el comienzo.
Cuando esté listo, haga clic en Comenzar lab.
Anote las credenciales del lab (el nombre de usuario y la contraseña). Las usarás para acceder a la consola de Google Cloud.
Haga clic en Abrir Google Console.
Haga clic en Usar otra cuenta, copie las credenciales para este lab y péguelas en el mensaje emergente que aparece.
Si usa otras credenciales, se generarán errores o incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación.
Tarea 1: Inicia un notebook en Vertex AI
En el menú de navegación de Google Cloud Console, haga clic en Vertex AI > Workbench.
En la página Instancias de notebook, haga clic en + Nuevo Notebook > TensorFlow Enterprise > TensorFlow Enterprise 2.3 (with LTS) > Without GPUs.
En el diálogo New notebook instance, confirme el nombre de la VM de aprendizaje profundo y, si no desea actualizar la región y la zona, deje todos los parámetros de configuración como están. Luego, haga clic en Create.
La VM nueva tardará 2 o 3 minutos en iniciarse.
Haga clic en Open JupyterLab.
Se abrirá en una pestaña nueva.
En la ventana emergente que indica Build recommended, haga clic en Build. Si ve que la compilación falló, ignórela.
Tarea 2. Clona el repo del curso en tu instancia de notebook de Vertex AI
Sigue estos pasos para clonar el notebook training-data-analyst en tu instancia de JupyterLab:
Para abrir una nueva terminal en JupyterLab, haz clic en el ícono de Terminal.
En la ventana de la línea de comandos, ejecuta el siguiente comando:
Para verificar que se haya clonado el repositorio, haz doble clic en el directorio training-data-analyst y confirma que puedes ver el contenido.
Los archivos de todos los labs de Jupyter basados en notebooks de este curso se encuentran disponibles en este directorio.
Tarea 3: Explora tf.Transform
En la interfaz del notebook, navega a training-data-analyst > courses > machine_learning > deepdive2 > feature_engineering > labs > 5_tftransform_taxifare.ipynb.
En la interfaz del notebook, haz clic en Editar > Borrar todos los resultados.
Lea con atención las instrucciones del notebook y complete con el código correspondiente las líneas que están marcadas con #TODO.
Sugerencia: Para ejecutar la celda actual, puedes hacer clic en ella y presionar Mayúsculas + Intro. Podrá encontrar otros comandos de la celda en la IU del notebook, en Ejecutar.
Las tareas también pueden incluir sugerencias que te orientarán. Destaca el texto para leer las sugerencias (están escritas en blanco).
Si necesitas más ayuda, consulta la solución completa. Para ello, navega a training-data-analyst > courses > machine_learning > deepdive2 > feature_engineering > solutions y abre 5_tftransform_taxifare.ipynb.
Finalice su lab
Cuando haya completado su lab, haga clic en Finalizar lab. Qwiklabs quitará los recursos que usó y limpiará la cuenta por usted.
Tendrá la oportunidad de calificar su experiencia en el lab. Seleccione la cantidad de estrellas que corresponda, ingrese un comentario y haga clic en Enviar.
La cantidad de estrellas indica lo siguiente:
1 estrella = Muy insatisfecho
2 estrellas = Insatisfecho
3 estrellas = Neutral
4 estrellas = Satisfecho
5 estrellas = Muy satisfecho
Puede cerrar el cuadro de diálogo si no desea proporcionar comentarios.
Para enviar comentarios, sugerencias o correcciones, use la pestaña Asistencia.
Copyright 2020 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.
Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
.
Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar
Usa la navegación privada
Copia el nombre de usuario y la contraseña proporcionados para el lab
Haz clic en Abrir la consola en modo privado
Accede a la consola
Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
Acepta las condiciones y omite la página de recursos de recuperación
No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto
Este contenido no está disponible en este momento
Te enviaremos una notificación por correo electrónico cuando esté disponible
¡Genial!
Nos comunicaremos contigo por correo electrónico si está disponible
Un lab a la vez
Confirma para finalizar todos los labs existentes y comenzar este
Usa la navegación privada para ejecutar el lab
Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así
evitarás cualquier conflicto entre tu cuenta personal y la cuenta
de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
La biblioteca tf.Transform permite a los usuarios definir canalizaciones de procesamiento previo y ejecutarlas mediante frameworks de procesamiento de datos a gran escala y, al mismo tiempo, exportar las canalizaciones para ejecutarlas como parte de un grafo de TensorFlow.
Duración:
0 min de configuración
·
Acceso por 120 min
·
120 min para completar