Instrucciones y requisitos de configuración del lab
Protege tu cuenta y tu progreso. Usa siempre una ventana de navegador privada y las credenciales del lab para ejecutarlo.

Analiza datos multimodales, y realiza tareas de razonamiento con ellos, con Gemini: Lab de desafío

Lab 25 minutos universal_currency_alt 5 créditos show_chart Intermedio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Este contenido aún no está optimizado para dispositivos móviles.
Para obtener la mejor experiencia, visítanos en una computadora de escritorio con un vínculo que te enviaremos por correo electrónico.

GSP524

Logotipo de los labs de autoaprendizaje de Google Cloud

Descripción general

En un lab de desafío, se le proporcionarán una situación y un conjunto de tareas. En lugar de seguir instrucciones paso a paso, deberás utilizar las habilidades aprendidas en los labs del curso para decidir cómo completar las tareas por tu cuenta. Un sistema automatizado de puntuación (en esta página) mostrará comentarios y determinará si completaste tus tareas correctamente.

En un lab de desafío, no se explican conceptos nuevos de Google Cloud, sino que se espera que amplíes las habilidades que adquiriste, como cambiar los valores predeterminados y leer o investigar los mensajes de error para corregir sus propios errores.

Debe completar correctamente todas las tareas dentro del período establecido para obtener una puntuación del 100%.

Se recomienda este lab a los estudiantes inscritos en el curso Analiza datos multimodales, y realiza tareas de razonamiento con ellos, con Gemini. ¿Aceptas el desafío?

Requisitos previos

Antes de comenzar este lab, debes tener los siguientes conocimientos:

  • Programación de Python básica
  • Conceptos generales sobre APIs
  • Ejecución de código de Python en un notebook de Jupyter en Vertex AI Workbench

Temas evaluados

En este desafío, usarás el modelo para realizar las siguientes tareas:

  • Crear y ejecutar instrucciones multimodales complejas para analizar datos de texto, imágenes, audio y video
  • Extraer información estructurada (p. ej., puntuaciones de opiniones, temas clave, detección de objetos, características de audio y reconocimiento de acciones) de datos multimodales
  • Sintetizar información de múltiples modalidades de datos para sacar conclusiones significativas y proporcionar recomendaciones prácticas
  • Dar formato a los resultados de los modelos en un informe de Markdown estructurado para una comunicación eficaz de los hallazgos

Configuración y requisitos

Antes de hacer clic en el botón Comenzar lab

Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.

Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.

Para completar este lab, necesitarás lo siguiente:

  • Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.
Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
  • Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).
Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.

Situación del desafío

Cymbal Direct: Análisis de la participación en redes sociales para el lanzamiento de un producto nuevo

Cymbal Direct acaba de lanzar una nueva línea de indumentaria deportiva diseñada para mejorar el rendimiento durante diversas actividades. Para medir la percepción del público y el posible impacto en el mercado, Cymbal Direct tiene la tarea de analizar la participación en redes sociales en varias plataformas. Este análisis implica lo siguiente:

  • Texto: Análisis de opiniones de clientes y publicaciones en redes sociales para determinar la percepción y los temas clave
  • Imágenes: Análisis de imágenes publicadas por influencers y clientes que usan la ropa para identificar tendencias de estilo y patrones de uso
  • Audio: Análisis de un clip de audio de un episodio de podcast de una entrevista reciente sobre el lanzamiento del nuevo producto de Cymbal Direct

El objetivo es proporcionarle a Cymbal Direct estadísticas prácticas para perfeccionar su estrategia de marketing, mejorar sus productos y reforzar el posicionamiento de productos. ¿Aceptas el desafío?

Tarea 1: Abre el notebook en Vertex AI Workbench

  1. En el menú de navegación (Ícono del menú de navegación) de la consola de Google Cloud, haz clic en Vertex AI > Workbench.

  2. Busca la instancia y haz clic en el botón Abrir JupyterLab.

La interfaz de JupyterLab para tu instancia de Workbench se abrirá en una pestaña nueva del navegador.

Nota: Si no ves notebooks en JupyterLab, sigue estos pasos adicionales para restablecer la instancia:

1. Cierra la pestaña del navegador de JupyterLab y vuelve a la página principal de Workbench.

2. Selecciona la casilla de verificación junto al nombre de la instancia y haz clic en Restablecer.

3. Después de que se vuelva a habilitar el botón Abrir JupyterLab, espera un minuto y, luego, haz clic en Abrir JupyterLab.

  1. Haz clic en el archivo .

  2. En el cuadro de diálogo Select Kernel, elige Python 3 en la lista de kernels disponibles.

  3. Completa la tarea Task 1 en el notebook para importar las bibliotecas y, luego, instalar el SDK de IA generativa.

Cuando completes la tarea Task 1 y configures tu entorno, tendrás todo listo para avanzar a las próximas secciones.

En las siguientes tareas, debes completar las partes faltantes de cada celda para pasar a la sección que sigue. Las partes faltantes se indican con TODO y una instrucción para completarlas.

Haz clic en Revisar mi progreso para verificar el objetivo. Importar las bibliotecas requeridas y configurar el SDK de IA generativa

Tarea 2: Analiza datos de texto y realiza tareas de razonamiento a partir de ellos

En esta tarea, recopilarás información sobre la nueva indumentaria deportiva de Cymbal Direct con el modelo para analizar las opiniones de los clientes y las publicaciones en redes sociales en formato de texto. Luego, guardarás los resultados del modelo en un archivo de Markdown para usarlos en un informe exhaustivo en la última tarea.

Nota: Tus tareas se etiquetan con una sección #TODO en cada celda. Lee cada celda con atención y asegúrate de completarlas correctamente. Revisa tu progreso para asegurarte de que completaste las celdas correctamente.

En el notebook, usa las celdas de la sección Tarea 2: Analiza los comentarios de los clientes (texto) y realiza tareas de razonamiento a partir de ellos para esta tarea.

Análisis inicial con

En la sección Análisis inicial con del notebook, haz lo siguiente:

  1. En la celda del notebook, en 3. Crea la instrucción para Gemini, completa las celdas etiquetadas con TODO para crear una instrucción que le indique al modelo de Gemini que analice las opiniones de los clientes y las publicaciones de redes sociales.

  2. En la celda del notebook, en 4. Envía la instrucción a Gemini, completa las celdas etiquetadas con TODO para enviar la instrucción y los datos de texto al modelo de Gemini.

Haz clic en Revisar mi progreso para verificar el objetivo. Realizar un análisis inicial con .

Análisis en profundidad con : Realiza tareas de razonamiento sobre el sentimiento de los clientes

En esta sección, usarás el pensamiento de Gemini para profundizar en el sentimiento de los clientes y, así, identificar áreas clave para mejorar. Es particularmente interesante el razonamiento detrás de las opiniones positivas y negativas, y descubrir cualquier tema recurrente que no sea evidente de inmediato.

  1. En el notebook, en la sección Análisis en profundidad con : Realiza tareas de razonamiento sobre el sentimiento de los clientes, en 1. Crea la instrucción para Gemini, completa las celdas etiquetadas con TODO para crear una instrucción que le indique al modelo de Gemini que analice las opiniones de los clientes y las publicaciones de redes sociales con mayor detalle.

  2. En 2. Usa el pensamiento de Gemini para un razonamiento más profundo, completa las celdas etiquetadas con TODO para enviar la instrucción y los datos de texto al modelo de Gemini.

Haz clic en Revisar mi progreso para verificar el objetivo. Análisis en profundidad con : Realizar tareas de razonamiento sobre el sentimiento de los clientes

Tarea 3: Analiza el contenido visual y realiza tareas de razonamiento a partir de él

En esta tarea, usarás el modelo para analizar imágenes relacionadas con la nueva línea de indumentaria deportiva de Cymbal Direct. El objetivo es identificar tendencias de estilo y el comportamiento de los clientes en función de las imágenes. Guardarás los resultados del modelo en un archivo de Markdown que usarás para generar un informe exhaustivo en la última tarea.

Nota: Tus tareas se etiquetan con una sección #TODO en la celda. Lee cada celda con atención y asegúrate de completarlas correctamente. En esta página, podrás revisar tu progreso para asegurarte de que completaste las celdas correctamente.

En el notebook, usa las celdas de la Tarea 3: Analiza el contenido visual y realiza tareas de razonamiento a partir de él: Tendencias de estilo y comportamiento del cliente.

Análisis inicial con

  1. En el notebook, en la sección Análisis inicial con , en 3. Crea la instrucción para Gemini, completa las celdas etiquetadas con TODO para crear una instrucción que le indique al modelo de Gemini que analice las imágenes de la nueva línea de indumentaria deportiva de Cymbal Direct.

  2. En 4. Envía la instrucción y las imágenes a Gemini, completa las celdas etiquetadas con TODO para enviar la instrucción y las imágenes al modelo de Gemini.

Haz clic en Revisar mi progreso para verificar el objetivo. Realizar un análisis inicial con .

Realiza tareas de razonamiento sobre las tendencias de imágenes con

Ahora usarás el pensamiento de Gemini para realizar un análisis más profundo de los elementos visuales, inferir el contexto, el público objetivo y las posibles implicaciones de marketing.

  1. En el notebook, en la sección Realiza tareas de razonamiento sobre las tendencias de imágenes con , en 1. Crea la instrucción para Gemini, completa las celdas etiquetadas con TODO para crear una instrucción que le indique al modelo de Gemini que analice las imágenes con mayor detalle.

  2. En 2. Usa el pensamiento de Gemini para un razonamiento más profundo, completa las celdas etiquetadas con TODO para enviar la instrucción y las imágenes al modelo de Gemini.

Haz clic en Revisar mi progreso para verificar el objetivo. Realizar tareas de razonamiento sobre las tendencias de imágenes con .

Tarea 4: Analiza el contenido de audio y realiza tareas de razonamiento a partir de él

En esta tarea, usarás el modelo para analizar un podcast sobre la nueva línea de ropa de Cymbal Direct. Extraerás información y el sentimiento sobre ella para usarlos en la generación de estadísticas para la empresa. Luego, guardarás los resultados del modelo en un archivo de Markdown para usarlos en un informe exhaustivo en la última tarea.

Este clip de audio es de un episodio de podcast en el que se entrevista a un representante de Cymbal Direct para que hable sobre la nueva línea de indumentaria deportiva. La conversación abarca varios aspectos de la indumentaria, como el diseño, las características, el público objetivo y la estrategia de marketing.

Nota: Tus tareas se etiquetan con una sección #TODO en cada celda. Lee cada celda con atención y asegúrate de completarlas correctamente. Revisa tu progreso para asegurarte de que completaste las celdas correctamente.

En el notebook, usa las celdas de la Tarea 4: Analiza el contenido de audio y realiza tareas de razonamiento a partir de él: Percepciones de los clientes para esta tarea.

Análisis inicial con

  1. En el notebook, en la sección Análisis inicial con , en 1. Crea la instrucción para Gemini, completa las celdas etiquetadas con TODO para crear una instrucción que le indique al modelo de Gemini que analice la grabación de audio de la conversación sobre la nueva línea de indumentaria deportiva de Cymbal Direct.

  2. En 2. Envía la instrucción y el audio a Gemini, completa las celdas etiquetadas con TODO para enviar la instrucción y los datos de audio al modelo de Gemini.

Haz clic en Revisar mi progreso para verificar el objetivo. Realizar un análisis inicial con .

Realiza tareas de razonamiento sobre las estadísticas de audio con

En esta sección, usarás el pensamiento de Gemini para analizar la conversación a un nivel más profundo, realizar tareas de razonamiento sobre la satisfacción del cliente, deducir factores influyentes y generar recomendaciones basadas en datos.

  1. En el notebook, en la sección Realiza tareas de razonamiento sobre las estadísticas de audio con , en 1. Crea la instrucción para Gemini, completa las celdas etiquetadas con TODO para crear una instrucción que le indique al modelo de Gemini que analice las grabaciones de audio con mayor detalle.

  2. En 2. Usa el pensamiento de Gemini para un razonamiento más profundo, completa las celdas etiquetadas con TODO para enviar la instrucción y los datos de audio al modelo de Gemini.

Haz clic en Revisar mi progreso para verificar el objetivo. Realizar tareas de razonamiento sobre las estadísticas de audio con .

Tarea 5: Sintetiza las estadísticas multimodales

En esta última tarea, sintetizarás las estadísticas obtenidas de los análisis anteriores de datos de texto, imágenes y audio. Usarás el modelo para generar un informe exhaustivo que consolide los hallazgos de cada modalidad y te brinde una visión integral del sentimiento de los clientes, las preferencias de estilo y las tendencias clave relacionadas con la nueva línea de indumentaria deportiva de Cymbal Direct.

Luego, guardas el informe final generado por el modelo en un archivo de Markdown que, luego, subirás a Cloud Storage para revisarlo y evaluarlo. Este informe exhaustivo será un recurso valioso para Cymbal Direct, ya que les permitirá tomar decisiones fundamentadas y optimizar sus estrategias en función de una comprensión detallada de las percepciones de los clientes y las tendencias de mercado.

Nota: Tus tareas se etiquetan con una sección #TODO en cada celda. Lee cada celda con atención y asegúrate de completarlas correctamente. En esta página, podrás revisar tu progreso para asegurarte de que completaste las celdas correctamente.
  1. En el notebook, en la Tarea 5: Sintetiza las estadísticas multimodales: Genera un informe exhaustivo, en 3. Crea la instrucción para Gemini, completa las celdas etiquetadas con TODO para crear una instrucción que le indique al modelo de Gemini que genere un informe exhaustivo basado en los resultados del análisis combinado.

  2. En 4. Envía la instrucción a Gemini, completa las celdas etiquetadas con TODO para enviar la instrucción al modelo de Gemini.

Haz clic en Revisar mi progreso para verificar el objetivo. Sintetizar las estadísticas multimodales: Generar un informe exhaustivo

¡Felicitaciones!

¡Felicitaciones! En este lab, usaste correctamente el modelo para analizar datos multimodales, incluidos texto, imágenes y audio, y obtener estadísticas valiosas para la nueva línea de indumentaria deportiva de Cymbal Direct. Demostraste competencia en la redacción de instrucciones eficaces, aprovechaste el razonamiento y el presupuesto de pensamiento, y generaste un informe exhaustivo con recomendaciones prácticas.

Próximos pasos/Más información

Consulta los siguientes recursos para obtener más información sobre Gemini:

Capacitación y certificación de Google Cloud

Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.

Última actualización del manual: 27 de octubre de 2025

Prueba más reciente del lab: 27 de octubre de 2025

Copyright 2026 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Antes de comenzar

  1. Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
  2. .
  3. Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
  4. En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar

Usa la navegación privada

  1. Copia el nombre de usuario y la contraseña proporcionados para el lab
  2. Haz clic en Abrir la consola en modo privado

Accede a la consola

  1. Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
  2. Acepta las condiciones y omite la página de recursos de recuperación
  3. No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible

Un lab a la vez

Confirma para finalizar todos los labs existentes y comenzar este

Usa la navegación privada para ejecutar el lab

Usar una ventana de incógnito o de navegación privada es la mejor forma de ejecutar este lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.