Send a text prompt to Gen AI and receive a image response
Revisar mi progreso
/ 100
Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
bb-ide-genai-002
Descripción general
- Los labs se cronometran y no se pueden pausar. El cronómetro comienza a funcionar cuando haces clic en Comenzar lab.
- La terminal de Cloud incluida está preconfigurada con el SDK de gcloud.
- Usa la terminal para ejecutar comandos y, luego, haz clic en Revisar mi progreso para verificar tu trabajo.
Objetivo
La IA generativa en Agent Platform (también conocida como genAI o gen AI) te
da acceso a los grandes modelos de IA generativa de Google para que puedas
probarlos, implementarlos y ajustarlos en tus aplicaciones impulsadas por IA.f
En este lab, aprenderás a hacer lo siguiente:
-
Conéctate an Agent Platform (plataforma de IA de Google Cloud):
Aprende a establecer una conexión con los servicios de IA de Google usando
el SDK de Agent Platform.
-
Carga un modelo de generación de imágenes previamente entrenado :
Descubre cómo usar un modelo de IA potente y previamente entrenado sin tener
que crear uno desde cero.
-
Envía texto al modelo de IA: Comprende cómo proporcionar
entradas para que la IA las procese.
-
Extrae respuestas basadas en imágenes de la IA: Aprende a
manejar e interpretar las respuestas de imágenes generadas por el modelo de
IA.
-
Comprende los conceptos básicos de la creación de aplicaciones de
IA:
Obtén información sobre los conceptos básicos de la integración de la IA en
proyectos de software.
Trabaja con la IA generativa
Después de iniciar el lab, obtendrás una vista de panel dividido que consta
del editor de código en el lado izquierdo y las instrucciones del lab en el
lado derecho. Sigue estos pasos para interactuar con las APIs de IA generativa
usando el SDK de Agent Platform para Python.
-
Haz clic en Archivo > Nuevo archivo para abrir un archivo
nuevo en el editor de código.
- Copia y pega en tu archivo el fragmento de código que se proporciona:
import argparse import vertexai from vertexai.preview.vision_models import
ImageGenerationModel def generate_image( project_id: str, location: str,
output_file: str, prompt: str ) ->
vertexai.preview.vision_models.ImageGenerationResponse: """Generate an image
using a text prompt. Args: project_id: Google Cloud project ID, used to
initialize Agent Platform. location: Google Cloud region, used to initialize
Agent Platform. output_file: Local path to the output image file. prompt: The
text prompt describing what you want to see."""
vertexai.init(project=project_id, location=location) model =
ImageGenerationModel.from_pretrained("imagen-3.0-generate-002") images =
model.generate_images( prompt=prompt, # Optional parameters
number_of_images=1, seed=1, add_watermark=False, )
images[0].save(location=output_file) return images generate_image(
project_id='{{{ project_0.project_id | "project-id" }}}', location='{{{
project_0.default_region | "REGION" }}}', output_file='image.jpeg',
prompt='Create an image of a cricket ground in the heart of Los Angeles', )
-
Haz clic en Archivo > Guardar, ingresa
GenerateImage.py en el campo Nombre y haz clic en
Guardar.
-
Ejecuta el archivo de Python haciendo clic en el ícono del triángulo en el
editor de código o invocando el siguiente comando en la terminal dentro del
panel del editor de código. Esto generará un archivo de imagen con el nombre
image.jpeg.
/usr/bin/python3 /GenerateImage.py
-
Ahora, para ver la imagen generada, haz clic en
EXPLORADOR > image.jpeg.
Explicación del código
-
El fragmento de código carga un modelo de IA previamente entrenado llamado
ImageGenerationModel (imagen-3.0-generate-002) en Agent
Platform.
-
El código llama al método
generate_image del modelo de Gemini
cargado.
- La entrada del método es una instrucción de texto.
-
El código aprovecha la capacidad de Gemini para comprender la instrucción de
texto y la usa para crear una imagen de IA.
Nota: De forma predeterminada, se agrega una marca de agua
de SynthID a las imágenes, pero puedes inhabilitarla especificando el
parámetro opcional add_watermark=False. No puedes usar un valor
semilla y una marca de agua al mismo tiempo. Obtén más información sobre la
marca de agua SynthID.
Compruébalo. Experimenta con diferentes instrucciones para
explorar las capacidades de Gemini.
Haz clic en Revisar mi progreso para verificar el objetivo.
Enviar a la IA generativa las solicitudes mediante instrucciones de texto y
recibir una respuesta
¡Felicitaciones!
Completaste el lab. ¡Felicitaciones!
Copyright 2026 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.