Obtén acceso a más de 700 labs y cursos

Crea una app de reconocimiento de imágenes potenciada por IA con Gemini en Vertex AI

Lab 15 minutos universal_currency_alt Sin costo show_chart Introductorio

info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.

Descripción general
Objetivo
Trabaja con el SDK de Vertex AI para Python
Explicación del código
¡Felicitaciones!

Obtén acceso a más de 700 labs y cursos

Logotipo de los labs de autoaprendizaje de Google Cloud

Descripción general

Los labs se cronometran y no se pueden pausar. El cronómetro comienza a funcionar cuando haces clic en Comenzar lab.
La terminal de Cloud incluida está preconfigurada con el SDK de gcloud.
Usa la terminal para ejecutar comandos y, luego, haz clic en Revisar mi progreso para verificar tu trabajo.

Objetivo

La IA generativa en Vertex AI (también conocida como genAI o gen AI) te da acceso a los grandes modelos de IA generativa de Google para que puedas probarlos, implementarlos y ajustarlos en tus aplicaciones impulsadas por IA. En este lab, aprenderás a hacer lo siguiente:

Conéctate a Vertex AI (plataforma de IA de Google Cloud): Aprende a establecer una conexión con los servicios de IA de Google usando el SDK de Vertex AI.
Con Gemini, carga un modelo de IA generativa previamente entrenado: Descubre cómo usar un modelo de IA potente y previamente entrenado sin tener que crear uno desde cero.
Envía preguntas de imagen y texto al modelo de IA: Comprende cómo proporcionar entradas para que la IA las procese.
Extrae respuestas basadas en texto de la IA: Aprende a manejar e interpretar las respuestas de texto generadas por el modelo de IA.
Comprende los conceptos básicos de la creación de aplicaciones de IA: Obtén información sobre los conceptos básicos de la integración de la IA en proyectos de software.

Trabaja con el SDK de Vertex AI para Python

Después de iniciar el lab, obtendrás una vista de panel dividido que consta del editor de código en el lado izquierdo y las instrucciones del lab en el lado derecho. Sigue estos pasos para interactuar con las APIs de IA generativa usando el SDK de Vertex AI para Python.

Haz clic en Archivo > Archivo nuevo para abrir un archivo nuevo en el editor de código.
Copia y pega en tu archivo el fragmento de código que se proporciona:

from google import genai from google.genai.types import HttpOptions, Part client = genai.Client(http_options=HttpOptions(api_version="v1")) response = client.models.generate_content( model="gemini-2.0-flash-001", contents=[ "What is shown in this image?", Part.from_uri( file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg", mime_type="image/jpeg", ), ], ) print(response.text)

Haz clic en Archivo > Guardar, ingresa genai.py en el campo Nombre y haz clic en Guardar.
Para configurar las variables de entorno en la nueva terminal, ejecuta el siguiente comando:
export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}' export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}' export GOOGLE_GENAI_USE_VERTEXAI=True
Para ver el resultado, ejecuta el archivo de Python invocando el siguiente comando en la terminal del panel del editor de código:

/usr/bin/python3 /genai.py

Nota: Si ves un error 400, intenta volver a ejecutar el código.

Explicación del código

El fragmento de código carga un modelo de IA previamente entrenado llamado Gemini (gemini-2.0-flash-001) en Vertex AI.
El código llama al método generate_content del modelo de Gemini cargado.
La entrada del método es un URI de imagen y una instrucción que contiene una pregunta sobre la imagen.
El código usa la capacidad de Gemini para comprender imágenes y texto en conjunto. Usa el texto proporcionado en la instrucción para describir el contenido de la imagen.

Compruébalo. Experimenta con diferentes URIs de imágenes y preguntas de instrucciones para explorar las capacidades de Gemini.

Haz clic en Revisar mi progreso para verificar el objetivo.

Generar contenido para la imagen

¡Felicitaciones!

Completaste el lab. ¡Felicitaciones!

Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Crea una app de reconocimiento de imágenes potenciada por IA con Gemini en Vertex AI

Descripción general

Objetivo

Trabaja con el SDK de Vertex AI para Python

Explicación del código

¡Felicitaciones!

Antes de comenzar

Usa la navegación privada

Accede a la consola

Usa la navegación privada para ejecutar el lab