Explora las capacidades multimodales de Google AI Studio

Lab 25 minutos universal_currency_alt Sin costo show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Este contenido aún no está optimizado para dispositivos móviles.
Para obtener la mejor experiencia, visítanos en una computadora de escritorio con un vínculo que te enviaremos por correo electrónico.

GSP1336

Logotipo de los labs de autoaprendizaje de Google Cloud

Descripción general

En este lab, explorarás las potentes capacidades multimodales de Google AI Studio, con un enfoque en la IA generativa y la comprensión espacial. A través de ejercicios prácticos, obtendrás experiencia práctica con modelos de IA de vanguardia y aprenderás a integrarlos en tus aplicaciones. Como curador de museo y diseñador de exposiciones, usarás estas herramientas para obtener ideas y crear prototipos de elementos para una nueva exposición de museo.

Qué aprenderás

En este lab, aprenderás a hacer lo siguiente:

  • Indicarles a los modelos que generen imágenes y clips de video
  • Solicitarle a un modelo que analice un video de formato largo
  • Desarrollar una app de comprensión espacial a partir de una plantilla
  • Pedirle al prototipo de la app de comprensión espacial que identifique elementos en una imagen

Configuración y requisitos

Antes de hacer clic en el botón Comenzar lab

Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.

Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.

Para completar este lab, necesitarás lo siguiente:

  • Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.
Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
  • Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).
Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.

Abre Google AI Studio

  1. Haz clic en Comenzar lab. En el panel del lab, se mostrarán las credenciales temporales que necesitarás.

    • Nota: Si se trata de un lab pagado, se te pedirá que selecciones una forma de pago.
  2. Abre Google AI Studio en una ventana de incógnito. Aparecerá la página de acceso de Google.

    • Sugerencia: Para facilitar el acceso, organiza las pestañas del lab y de AI Studio en ventanas separadas, una junto a la otra.
  3. Copia el Nombre de usuario que se muestra a continuación y pégalo en el campo Correo electrónico. Luego, haz clic en Siguiente.

    {{{user_0.username | "Username"}}}
  4. Copia la contraseña que aparece a continuación y pégala en el campo Ingresa tu contraseña; luego, haz clic en Siguiente.

    {{{user_0.password | "Password"}}}
  5. Acepta los Términos y Condiciones que aparecen en pantalla para continuar.

Ahora accediste a Google AI Studio con tu cuenta de estudiante temporal.

Tarea 1: Genera imágenes y clips de video

En esta tarea, actuarás como curador y generarás arte conceptual y un breve video promocional para una nueva exposición de dinosaurios. Esto implica usar modelos diseñados específicamente para la generación de contenido multimedia.

Genera arte conceptual con la generación de imágenes de Gemini

  1. En el menú de navegación de la izquierda, haz clic en Chat.

  2. Selecciona Imágenes y, luego, Imagen en las opciones que se muestran.

  3. En el campo de entrada de instrucción, ingresa una solicitud para tu arte conceptual:

Una imagen fotorrealista de un vestíbulo de museo de historia natural futurista, con un esqueleto de tiranosaurio rex hecho con cristales azules brillantes.
  1. Haz clic en Ejecutar y revisa la imagen generada. Esta imagen podría servir como base para el diseño de tu nueva exposición.

  2. Guarda tus instrucciones y respuestas haciendo clic en el ícono de guardar instrucción guardar para editar el título y la descripción de la instrucción.

  3. Se abrirá una nueva ventana emergente. Elige tu cuenta de estudiante (p. ej., student-XX-YYYY@qwiklabs.net) y otorga los permisos necesarios para continuar.

    • En Nombre del mensaje, escribe Vestíbulo de museo futurista.
  4. Haz clic en Guardar.

Genera un clip de video promocional con Veo

  1. En el menú de navegación de la izquierda, haz clic en Chat.

  2. Selecciona Video y, luego, Veo en las opciones para generar un video.

  3. En el panel de la derecha, busca el parámetro de configuración Duración del video y ajústalo a 8 s. Establece la Relación de aspecto en 9:16.

  4. En el campo de entrada de instrucción, describe un clip corto y dinámico para redes sociales:

Un video cinemático y en cámara lenta de un tricerátops animatrónico detallado que gira su cabeza y pestañea.
  1. Haz clic en Ejecutar.
Nota: Si aparece el diálogo titulado Permitir el acceso a Drive, haz clic en el botón Permitir acceso. Se abrirá una nueva ventana emergente. Elige tu cuenta de estudiante (p. ej., student-XX-YYYY@qwiklabs.net) y otorga los permisos necesarios para continuar.
  1. El modelo comenzará a generar tu video. Revisa el clip haciendo clic en la opción Reproducir video cuando aparezca.

Haz clic en Revisar mi progreso para verificar el objetivo. Generar imágenes y clips de video

Tarea 2: Solicita a un modelo que analice un video de formato largo

En esta tarea, investigarás exhibiciones exitosas existentes pidiéndole a Gemini que analice un recorrido en video del American Museum of Natural History.

  1. En el menú de navegación de la izquierda, haz clic en Chat para volver a la interfaz principal del chat.

  2. En el panel de la derecha, abre la barra lateral Configuración de la ejecución y haz clic en el modelo de Gemini predeterminado (actualmente establecido en Nano Banana) para seleccionar otro modelo.

  3. En Selección del modelo, haz clic en la pestaña Gemini y selecciona el modelo , ya que está diseñado para controlar entradas grandes, como videos.

  4. Haz clic en el ícono de archivos adjuntos (un signo más dentro de un círculo) en la barra de instrucciones y selecciona Sample Media.

  5. En la lista de videos, selecciona American Museum of Natural History Tour - 10 Min y haz clic en Agregar a la instrucción.

  6. Espera a que se procese el video. Verás el video en el área de instrucciones con el recuento de tokens que se muestra.

Nota: Verás un gran recuento de tokens después de agregar el video. Un modelo de lenguaje "ve" un video como una secuencia de miles de fotogramas individuales. Cada fotograma se convierte en datos numéricos llamados tokens para que el modelo los analice. El tiempo de procesamiento que ves es el tiempo que el modelo tarda en "leer" todos estos tokens antes de poder responder tu pregunta sobre el video.
  1. En el campo de texto que aparece sobre el video, ingresa la siguiente instrucción:
Crea un resumen de las exhibiciones principales que se muestran en este video de recorrido. Enumera cada sección o sala y escribe una descripción de una oración para cada uno.
  1. Haz clic en Ejecutar y revisa el resumen de texto del modelo sobre el contenido del video.

  2. En Nombre del mensaje, escribe Aspectos destacados de las exhibiciones del museo.

  3. Haz clic en Guardar.

Haz clic en Revisar mi progreso para verificar el objetivo. Solicitarle a un modelo que analice un video de formato largo

Tarea 3: Desarrolla una app de comprensión espacial a partir de una plantilla

En esta tarea, crearás rápidamente un prototipo de una función interactiva "Preguntarle a la exposición" para los visitantes del museo creando una app a partir de una plantilla sin escribir código.

  1. En el menú de navegación de la izquierda, haz clic en Compilar.

  2. Desplázate por la galería de plantillas de apps para encontrar la tarjeta Comprensión espacial.

  3. Haz clic en la plantilla Comprensión espacial para generar al instante el prototipo de la app.

Página de prototipo de la app de comprensión espacial

  1. La interfaz se cargará con el código de la aplicación en el centro y una vista previa en tiempo real de la app a la derecha.

Haz clic en Revisar mi progreso para verificar el objetivo. Desarrollar una app de comprensión espacial a partir de una plantilla

Tarea 4: Escribe una instrucción para el prototipo de la app de comprensión espacial

En esta tarea, probarás el prototipo que acabas de crear. Simularás la interacción de un visitante pidiéndole a la app que identifique objetos dentro de una imagen de muestra de una exposición de un festival de cosecha y modificarás el código para cambiar el color del cuadro delimitador.

Explora las funciones de la app

  1. En el panel Vista previa de la app, ubicado a la derecha, busca las imágenes de muestra en la parte inferior. Haz clic en la imagen que muestra varias calabazas en exhibición.

  2. Sobre el cuadro de instrucción, asegúrate de que esté seleccionado el botón Cuadros delimitadores 2D. En la casilla de entrada INSTRUCCIÓN, escribe calabaza y haz clic en Enviar. Observa los cuadros delimitadores estándar que se dibujan alrededor de las calabazas.

Nota: Un cuadro delimitador es un rectángulo en el que se destaca la ubicación precisa de un objeto en una imagen. Es la forma fundamental en que un modelo de visión artificial demuestra su comprensión espacial: mostrándote no solo lo que ve, sino dónde lo ve.
  1. Ahora, selecciona el botón Máscaras de segmentación y vuelve a hacer clic en Enviar. Observa cómo el resultado cambia a color en toda el área de cada calabaza detectada.

  2. Por último, selecciona el botón Puntos y haz clic en Enviar. Observa cómo el modelo coloca puntos clave sobre los objetos detectados.

Modifica la app con el asistente de código

  1. Antes de continuar, asegúrate de que el botón Cuadros delimitadores 2D esté seleccionado de nuevo en el panel de vista previa.

  2. Ahora, dirige tu atención al campo de entrada del asistente de código que se encuentra en la parte inferior izquierda de la pantalla y que dice "Realiza cambios o agrega funciones nuevas…". Escribe el siguiente comando:

Cambia el color de los cuadros delimitadores a rojo.
  1. Presiona Intro o haz clic en el botón de envío del asistente. Observa cómo el asistente modifica el código de la aplicación en la ventana del editor central.

  2. Una vez que se actualice el código, vuelve a enfocarte en el panel Vista previa de la derecha. Con la imagen de la calabaza y Cuadros delimitadores 2D aún seleccionado, haz clic en el botón Enviar para la instrucción calabaza por última vez.

  3. Observa el resultado. Los cuadros delimitadores dibujados alrededor de las calabazas ahora deberían ser rojos, lo que demuestra que modificaste correctamente una aplicación activa con un simple comando de texto.

  4. Desafío opcional: Ya viste lo fácil que es modificar la app con texto. Antes de terminar, prueba darle algunos comandos más al asistente de código. ¿Puedes descubrir cómo hacer lo siguiente?

    • ¿Cambiar el color del cuadro delimitador a verde?
    • ¿Cambiar la línea del cuadro delimitador a con puntos en lugar de que sea continua?
    • ¿Cambiar el cuadro delimitador a una línea gruesa y discontinua?
    • ¿Cambiar el color del texto de la etiqueta a blanco?
  5. Guarda la app haciendo clic en el ícono de guardar guardar para editar el título y la descripción de la instrucción.

    • En Nombre del mensaje, escribe Comprensión espacial.
  6. Haz clic en Guardar.

Haz clic en Revisar mi progreso para verificar el objetivo. Escribir una instrucción para el prototipo de la app de comprensión espacial

¡Felicitaciones!

¡Felicitaciones! Usaste correctamente las funciones multimodales de Google AI Studio para obtener ideas y crear un prototipo de una nueva exposición de museo. Generaste arte conceptual y clips de video, analizaste un recorrido en video existente y hasta creaste un prototipo interactivo con una app de comprensión espacial. Ahora tienes experiencia práctica con el uso de la IA, que puede ver, comprender y generar una variedad de contenido multimedia enriquecido.

Capacitación y certificación de Google Cloud

Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.

Última actualización del manual: 16 de octubre de 2025

Prueba más reciente del lab: 16 de octubre de 2025

Copyright 2026 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Antes de comenzar

  1. Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
  2. .
  3. Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
  4. En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar

Usa la navegación privada

  1. Copia el nombre de usuario y la contraseña proporcionados para el lab
  2. Haz clic en Abrir la consola en modo privado

Accede a la consola

  1. Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
  2. Acepta las condiciones y omite la página de recursos de recuperación
  3. No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible

Un lab a la vez

Confirma para finalizar todos los labs existentes y comenzar este

Usa la navegación privada para ejecutar el lab

Usar una ventana de incógnito o de navegación privada es la mejor forma de ejecutar este lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.