GSP1154

Descripción general
Vertex AI es una plataforma integral para el desarrollo del aprendizaje automático que ofrece capacidades predictivas y de IA generativa. Te permite entrenar, evaluar y también implementar modelos de aprendizaje automático predictivos con fines de previsión. Además, la puedes usar para descubrir, adaptar y entregar modelos de IA generativa para producir contenido.
Vertex AI Studio te permite probar y personalizar con rapidez modelos de IA generativa para que puedas aprovechar sus capacidades en tus aplicaciones. Proporciona varios recursos y herramientas, incluidos IU (interfaces de usuario) y ejemplos de programación, que facilitan comenzar a usar la IA generativa, incluso si no cuentas con una formación en aprendizaje automático.
En este lab, se te guiará por Vertex AI Studio para aprovechar el potencial de los modelos de IA generativa de vanguardia. Explorarás Gemini y lo usarás para analizar imágenes, diseñar instrucciones y descubrir capacidades multimodales directamente en la consola de Google Cloud. No se necesitan APIs ni SDK de Python; se puede acceder a todo a través de una interfaz de usuario intuitiva.
Objetivos
En este lab, aprenderás a hacer lo siguiente:
- Analizar imágenes con la función multimodal de Gemini
- Explorar las capacidades multimodales
- Diseñar instrucciones con ejemplos
- Diseñar instrucciones con contexto
Configuración y requisitos
Antes de hacer clic en el botón Comenzar lab
Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
- Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.
Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
- Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).
Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.
Cómo iniciar tu lab y acceder a la consola de Google Cloud
-
Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá un diálogo para que selecciones la forma de pago.
A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
- El botón para abrir la consola de Google Cloud
- El tiempo restante
- Las credenciales temporales que debes usar para el lab
- Otra información para completar el lab, si es necesaria
-
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordena las pestañas en ventanas separadas, una junto a la otra.
Nota: Si ves el diálogo Elegir una cuenta, haz clic en Usar otra cuenta.
-
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
{{{user_0.username | "Username"}}}
También puedes encontrar el nombre de usuario en el panel Detalles del lab.
-
Haz clic en Siguiente.
-
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
{{{user_0.password | "Password"}}}
También puedes encontrar la contraseña en el panel Detalles del lab.
-
Haz clic en Siguiente.
Importante: Debes usar las credenciales que te proporciona el lab. No uses las credenciales de tu cuenta de Google Cloud.
Nota: Usar tu propia cuenta de Google Cloud para este lab podría generar cargos adicionales.
-
Haz clic para avanzar por las páginas siguientes:
- Acepta los Términos y Condiciones.
- No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
- No te registres para obtener pruebas gratuitas.
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
Nota: Para acceder a los productos y servicios de Google Cloud, haz clic en el menú de navegación o escribe el nombre del servicio o producto en el campo Buscar.
Tarea 1: Analiza imágenes con Gemini
En esta sección, usarás Gemini para analizar una imagen y extraer información de ella. Puedes diseñar instrucciones para varios tipos de tareas, como la clasificación, extracción y generación.
- En el menú de navegación (
) de la consola de Google Cloud, selecciona Vertex AI > Vertex AI Studio > Crear instrucción.

La IU contiene tres secciones principales:
-
Instrucciones del sistema (ubicada en la parte superior): Es un conjunto de indicaciones que el modelo procesa antes de ejecutar las instrucciones. Cuando se establecen instrucciones del sistema, se aplican a toda la solicitud. Funcionan para varios turnos de usuarios y del modelo cuando se incluyen en la instrucción. Te recomendamos usarlas para indicarle al modelo cómo quieres que se comporte y responda a las instrucciones.
-
Configuración (ubicada a la derecha): En esta sección puedes seleccionar modelos (incluidos los de terceros), configurar parámetros, usar herramientas (como la fundamentación) y establecer opciones avanzadas.
-
Instrucción (ubicada en la parte inferior): Aquí, puedes crear una instrucción que utilice capacidades multimodales.

-
En la esquina superior izquierda, haz clic en Instrucción sin título y cambia el nombre de tu instrucción a Análisis de imágenes
.
-
En la sección Configuración de la derecha, asegúrate de que esté seleccionado el modelo . Si es necesario, puedes hacer clic en Switch model para reemplazarlo o explorar otros modelos disponibles.
Nota: El nombre y la versión del modelo pueden cambiar con el lanzamiento de nuevos modelos.
-
En la sección Configuración de la derecha, expande las opciones avanzadas y, en Región, selecciona .
-
Descarga la imagen de muestra. Haz clic con el botón derecho en la imagen del horario y, luego, guárdala en el escritorio.

-
En la parte inferior derecha de la sección Instrucción, haz clic en el botón Insertar contenido multimedia (
).
-
En el menú Seleccionar origen, haz clic en Subir y, luego, selecciona la imagen del horario que descargaste. El archivo multimedia puede ser una imagen, un video, un texto o un archivo de audio.
-
La imagen se mostrará en la sección Instrucción. Copia el siguiente texto, pégalo debajo de la imagen y haz clic en el botón de flecha Enviar en la parte inferior derecha de la sección Instrucción o presiona Intro.
Title the image.
O hazlo más específico:
Title the image in 5 words.
¿El título cumple con tus expectativas? Intenta modificar la instrucción para ver si obtienes resultados diferentes.
- A continuación, pídele a Gemini que describa la imagen en detalle. Reemplaza la instrucción anterior por lo siguiente y haz clic en el botón de flecha Enviar.
Describe the image in detail.
- En la sección Configuración, expande las opciones avanzadas y ajusta la Temperatura desplazándote de izquierda (0) a derecha (2). Vuelve a enviar la instrucción para observar cualquier cambio en el resultado, en comparación con el resultado anterior.
Nota: La temperatura controla el grado de aleatoriedad en la selección de tokens. Las temperaturas más bajas son buenas para las instrucciones que esperan una respuesta verdadera o correcta, mientras que las temperaturas más altas pueden generar resultados más diversos, inesperados o potencialmente sesgados. Con una temperatura de 0, siempre se selecciona el token de mayor probabilidad.
- Extrae el texto de la imagen. Reemplaza la instrucción anterior por lo siguiente:
Read the text in the image.
Además, si quieres que la salida se presente como una lista, reemplaza la instrucción anterior por lo siguiente:
Parse the time and city in this image into a list with two columns: time and city.
Es tu turno: prueba crear distintas instrucciones. ¿En qué se diferencian estos resultados de los anteriores?
- Analiza la información de la imagen. Reemplaza la instrucción anterior por lo siguiente:
Calculate the percentage of the flights to different continents.
¿El resultado cumple con tus expectativas? Te recomendamos que pruebes diferentes instrucciones para distintas tareas. También te recomendamos que experimentes con diferentes parámetros de configuración de temperatura para observar los cambios en el resultado.
-
Una vez que termines el diseño de la instrucción, haz clic en Guardar en la parte superior derecha de la barra de herramientas. En Región, selecciona en el menú desplegable y, luego, confirma con el botón Guardar.
-
Para ver tus instrucciones guardadas, navega a Administración de instrucciones en el menú de navegación de la izquierda.
Nota: Después de seleccionar Guardar, espera un momento a que las instrucciones se guarden correctamente y, luego, continúa con el lab.
Haz clic en Revisar mi progreso para verificar los objetivos.
Extraer el contenido de la imagen
Tarea 2: Explora las capacidades multimodales
Además de imágenes, texto y audio, Gemini también acepta videos como entrada y genera texto como resultado.
-
Navega a Cloud Storage > Buckets, copia el nombre de tu bucket de Cloud Storage y guárdalo para usarlo en el próximo paso: .
-
Haz clic en Activar Cloud Shell
en la parte superior de la consola de Google Cloud.
-
En tu terminal de Cloud Shell, ejecuta el siguiente comando para copiar el video de muestra gs://spls/gsp154/video/train.mp4
(vista previa) en tu bucket de Cloud Storage. Reemplaza <Your-Cloud-Storage-Bucket>
por el nombre del bucket que copiaste.
gcloud storage cp gs://spls/gsp154/video/train.mp4 gs://<Your-Cloud-Storage-Bucket>
Nota: Asegúrate de reemplazar <Your-Cloud-Storage-Bucket>
por el nombre de tu bucket.
-
En el menú de navegación (
), selecciona Vertex AI > Vertex AI Studio > Crear instrucción.
-
En la sección Configuración de la derecha, asegúrate de que esté seleccionado el modelo .
Nota: El nombre y la versión del modelo pueden cambiar con el lanzamiento de nuevos modelos.
-
Expande las opciones avanzadas y, en Región, selecciona .
-
En la parte inferior derecha de la sección Instrucción, haz clic en el botón Insertar contenido multimedia (
).
-
En el menú Seleccionar origen, selecciona Importar desde Cloud Storage.
-
Haz clic en el nombre de tu bucket y, luego, en el video de muestra, train.mp4
. A continuación, haz clic en Seleccionar.
-
Para generar información sobre el video, ingresa la siguiente instrucción y haz clic en el botón de flecha Enviar.
Title the video.
- Describe el video en detalle:
Describe the video in detail.
Obtén más información para diseñar instrucciones multimodales.
Tarea 3: Diseña instrucciones con ejemplos
En esta sección, explorarás el diseño de instrucciones de texto en Vertex AI Studio.
Diseño de instrucciones
Puedes proporcionarle al modelo el texto de entrada que desees, por ejemplo, una pregunta. El modelo ofrecerá una respuesta basándose en cómo hayas estructurado tu instrucción. El proceso de determinar y diseñar el mejor texto de entrada (instrucción) para obtener la respuesta deseada del modelo se llama Diseño de instrucciones.
Métodos de diseño de instrucciones
Hay tres métodos principales de diseño de instrucciones:
- La instrucción sin ejemplos es un método en el que se proporciona al LLM solo una instrucción que describe la tarea, sin datos adicionales. Por ejemplo, si quieres que el LLM responda una pregunta, solo escribe la instrucción: “¿Qué es el diseño de instrucciones?”.
- La instrucción con un solo ejemplo es un método en el que se proporciona al LLM un solo ejemplo de la tarea que se le pide que realice. Por ejemplo, si quieres que el LLM escriba un poema, puedes proporcionarle solo un poema de ejemplo.
- La instrucción con varios ejemplos es un método en el que se proporciona al LLM una pequeña cantidad de ejemplos de la tarea que se le pide que realice. Por ejemplo, si deseas que el LLM escriba un artículo de noticias, puedes proporcionarle algunos para leer.
Parámetros
La temperatura y el límite de tokens son dos parámetros importantes que puedes ajustar para influir en la respuesta del modelo.
- La temperatura controla la aleatorización en la selección de tokens. Una temperatura más baja es buena cuando esperas una respuesta verdadera o correcta. Una temperatura de 0 significa que siempre se elige el token de mayor probabilidad. Una temperatura más alta puede generar resultados más diversos, inesperados o potencialmente sesgados. El modelo tiene un rango de temperatura de 0 a 2, y 1 es la temperatura predeterminada.
- El límite de tokens de salida determina la cantidad máxima de salida de texto a partir de una instrucción. Un token tiene aproximadamente cuatro caracteres.
Instrucciones sin ejemplos
-
Haz clic en el ícono Borrar de la barra de herramientas para borrar la instrucción.
-
En la sección Configuración de la derecha, asegúrate de que esté seleccionado el modelo .
Nota: El nombre y la versión del modelo pueden cambiar con el lanzamiento de nuevos modelos.
-
Expande las opciones avanzadas y, en Región, selecciona .
-
Copia lo siguiente sobre el campo de entrada de la instrucción:
What is a prompt gallery?
- Haz clic en el botón de flecha Enviar.
El modelo responderá con una definición completa del término prompt gallery (galería de instrucciones).
- Estos son algunos ejercicios de exploración. Realiza estas acciones con la misma instrucción, en el campo de opciones avanzadas de la sección Configuración:
- Ajusta el parámetro del
Límite de tokens de salida
a 1,024
y haz clic en el botón de flecha ENVIAR.
- Ajusta el parámetro de la
Temperatura
a 0.5
y haz clic en el botón de flecha ENVIAR.
- Ajusta el parámetro de la
Temperatura
a 2.0
y haz clic en el botón de flecha ENVIAR.
Inspecciona cómo se modifican las respuestas cuando cambian los parámetros.
Instrucciones con un solo ejemplo
Puedes diseñar instrucciones de una forma más organizada. Puedes proporcionar Contexto y Ejemplos en sus respectivos campos de entrada. La instrucción con un solo ejemplo es un método en el que se proporciona al modelo un único ejemplo de la tarea que se le pide que realice. En esta sección, le pedirás al modelo que complete una oración.
-
Haz clic en el ícono Borrar de la barra de herramientas para borrar la instrucción.
-
En la esquina inferior derecha de la sección Instrucción, haz clic en el botón Agregar ejemplos (Add Examples) (
).

Se abrirá una nueva ventana en la que podrás agregar ejemplos para la instrucción.

- Agrega lo siguiente al campo ENTRADA:
The color of the grass is
- Agrega lo siguiente al campo SALIDA:
The color of the grass is green
-
Haz clic en el botón Agregar ejemplos.
-
Una vez que agregues tu ejemplo, deberías ver dos secciones que se deben completar: {Input}
y Prompt
. Para enviar la instrucción, deberás proporcionar otra entrada de ejemplo, además de la instrucción.

- En el campo
{INPUT}
, escribe lo siguiente:
The color of the sky is
- En el campo
Prompt
, escribe lo siguiente:
Answer the following questions.
La sección Instrucción debe ser similar a lo siguiente:

- Haz clic en el botón de flecha Enviar. Deberías recibir una respuesta del modelo similar a la siguiente:
The color of the sky is blue
En lugar de completar la oración, el modelo respondió con una oración completa, ya que le proporcionaste un ejemplo en el que pudo basar su respuesta. Para que solo complete la respuesta, puedes ajustar el ejemplo en el campo SALIDA.
- Haz clic en el botón Editar (Edit) en el cuadro Instrucción para editarla:

- Haz clic en los ejemplos para editarlos y, luego, cambia el resultado por lo siguiente:
Green
Tu instrucción de ejemplo ahora debería parecerse a la siguiente:
input: The color of the grass is
output: Green
- Haz clic en el botón de flecha Enviar. Deberías recibir una respuesta del modelo similar a la siguiente:
Blue
Como puedes ver, ahora el modelo completa la oración basándose en el ejemplo que le proporcionaste. Influenciaste correctamente la forma en la que el modelo produce una respuesta.
Instrucciones con varios ejemplos
En la próxima práctica, usarás el modelo para realizar un análisis de opiniones sobre una oración, por ejemplo, determinar si la opinión sobre una película es positiva o negativa usando una instrucción con varios ejemplos.
-
Haz clic en el ícono Borrar de la barra de herramientas para borrar la instrucción.
-
En la esquina inferior derecha de la sección Instrucción, haz clic en el botón Agregar ejemplos (
).
-
Agrega los siguientes ejemplos:
ENTRADA |
SALIDA |
Una película bien hecha y entretenida (A well-made and entertaining film) |
positivo (positive) |
Me quedé dormido luego de 10 minutos (I fell asleep after 10 minutes) |
negativo (negative) |
La película estuvo bien (The movie was ok) |
neutral |
- Una vez que agregues los ejemplos, haz clic en el botón Agregar ejemplos.

-
Una vez que agregues tu ejemplo, deberías ver dos secciones que se deben completar: {Input}
y Prompt
. Para enviar la instrucción, deberás proporcionar otra entrada de ejemplo, además de la instrucción.
-
En el campo {INPUT}
, escribe lo siguiente:
It was a time well spent!
- En el campo
Prompt
, escribe lo siguiente:
Perform sentiment analysis on the following text.
- Haz clic en el botón de flecha Enviar. Deberías recibir una respuesta del modelo similar a la siguiente:
positive
El modelo ahora proporciona una opinión para el texto de entrada. Para el texto It was a time well spent! (¡No tuvo desperdicio!), la opinión se etiqueta como positive (positiva).
-
Una vez que termines el diseño de la instrucción, asígnale el nombre Sentiment Analysis
.
-
Para guardar la instrucción, haz clic en Guardar en la parte superior derecha de la barra de herramientas y selecciona la región .
Nota: Si ya se guardó la instrucción con la funcionalidad Guardar automáticamente, asegúrate de que el nombre sea correcto y de que la puedas ver en la página Administración de instrucciones.
Haz clic en Revisar mi progreso para verificar los objetivos.
Crear instrucciones con texto
Tarea 4: Diseña instrucciones con contexto
Las instrucciones del sistema son directivas iniciales que determinan el comportamiento y las respuestas de un modelo respecto a instrucciones posteriores, lo que permite personalizar el formato, el tono, el arquetipo y las reglas de tareas específicas. Estas permanecen en varias interacciones entre el usuario y el modelo dentro de una solicitud. Los usuarios deben evitar incluir información sensible debido a las posibles políticas de uso de datos.
Además, son versátiles, ya que sirven para tareas como desarrollar chatbots, generar resultados estructurados y obtener respuestas en idiomas específicos, aunque no garantizan una protección completa contra los comportamientos no deseados de los modelos.
-
En el menú de navegación (
) de la consola de Google Cloud, selecciona Vertex AI > Vertex AI Studio > Crear instrucción.
-
En la sección Configuración de la derecha, asegúrate de que esté seleccionado el modelo .
Nota: El nombre y la versión del modelo pueden cambiar con el lanzamiento de nuevos modelos.
- En la sección Configuración de la derecha, expande las opciones avanzadas y, en Región, selecciona .
En esta sección, agregarás instrucciones del sistema para el modelo y lo dejarás responder en función del contexto proporcionado.
- Haz clic en Instrucciones del sistema y agrega el siguiente contexto:
Your name is Roy.
You are a support technician of an IT department.
You only respond with "Have you tried turning it off and on again?" to any queries.
- Ingresa la siguiente instrucción:
My computer is so slow! What should I do?
- Haz clic en el botón de flecha Enviar.
El modelo debería responder lo siguiente:
Have you tried turning it off and on again?
-
En Instrucciones del sistema, haz clic en Borrar valor (
).
-
Haz clic en Instrucciones del sistema y agrega el siguiente contexto:
Your name is Roy.
You are a support technician of an IT department.
You are here to support the users with their queries.
- Ingresa la siguiente instrucción:
My computer is so slow! What should I do?
- Haz clic en el botón de flecha Enviar.
El modelo debería proporcionar una respuesta más útil a la pregunta del usuario.
Si lo deseas, puedes experimentar con diferentes instrucciones y contextos para ver cómo responde el modelo. También puedes agregar más contexto a la instrucción de chat para ver cómo responde el modelo al contexto proporcionado.
- Una vez que termines el diseño de la instrucción, asígnale el nombre
Support Technician Helper
.
Haz clic en Revisar mi progreso para verificar los objetivos.
Crear conversaciones con instrucción de chat
¡Felicitaciones!
¡Felicitaciones! En este lab, aprovechaste correctamente las capacidades de Gemini para analizar contenido multimedia, como imágenes y videos. Demostraste tu competencia en las técnicas de instrucciones sin ejemplos, con un solo ejemplo y con varios ejemplos para responder preguntas y realizar análisis de opiniones. Además, usaste instrucciones del sistema de forma eficaz para crear un chatbot de TI básico.
Capacitación y certificación de Google Cloud
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Última actualización del manual: 9 de abril de 2025
Prueba más reciente del lab: 9 de abril de 2025
Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.