Obtén acceso a más de 700 labs y cursos

Crea una app de reconocimiento de imágenes potenciada por IA con Gemini en Vertex AI

Lab 15 minutos universal_currency_alt Sin costo show_chart Introductorio
info Es posible que este lab incorpore herramientas de IA para facilitar tu aprendizaje.
Obtén acceso a más de 700 labs y cursos

Logotipo de los labs de autoaprendizaje de Google Cloud

Descripción general

  • Los labs se cronometran y no se pueden pausar. El cronómetro comienza a funcionar cuando haces clic en Comenzar lab.
  • La terminal de Cloud incluida está preconfigurada con el SDK de gcloud.
  • Usa la terminal para ejecutar comandos y, luego, haz clic en Revisar mi progreso para verificar tu trabajo.

Objetivo

La IA generativa en Vertex AI (también conocida como genAI o gen AI) te da acceso a los grandes modelos de IA generativa de Google para que puedas probarlos, implementarlos y ajustarlos en tus aplicaciones impulsadas por IA. En este lab, aprenderás a hacer lo siguiente:

  • Conéctate a Vertex AI (plataforma de IA de Google Cloud): Aprende a establecer una conexión con los servicios de IA de Google usando el SDK de Vertex AI.
  • Con Gemini, carga un modelo de IA generativa previamente entrenado: Descubre cómo usar un modelo de IA potente y previamente entrenado sin tener que crear uno desde cero.
  • Envía preguntas de imagen y texto al modelo de IA: Comprende cómo proporcionar entradas para que la IA las procese.
  • Extrae respuestas basadas en texto de la IA: Aprende a manejar e interpretar las respuestas de texto generadas por el modelo de IA.
  • Comprende los conceptos básicos de la creación de aplicaciones de IA: Obtén información sobre los conceptos básicos de la integración de la IA en proyectos de software.

Trabaja con el SDK de Vertex AI para Python

Después de iniciar el lab, obtendrás una vista de panel dividido que consta del editor de código en el lado izquierdo y las instrucciones del lab en el lado derecho. Sigue estos pasos para interactuar con las APIs de IA generativa usando el SDK de Vertex AI para Python.

  1. Haz clic en Archivo > Archivo nuevo para abrir un archivo nuevo en el editor de código.
  2. Copia y pega en tu archivo el fragmento de código que se proporciona:
from google import genai from google.genai.types import HttpOptions, Part client = genai.Client(http_options=HttpOptions(api_version="v1")) response = client.models.generate_content( model="gemini-2.0-flash-001", contents=[ "What is shown in this image?", Part.from_uri( file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg", mime_type="image/jpeg", ), ], ) print(response.text)
  1. Haz clic en Archivo > Guardar, ingresa genai.py en el campo Nombre y haz clic en Guardar.

  2. Para configurar las variables de entorno en la nueva terminal, ejecuta el siguiente comando:

    export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}' export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}' export GOOGLE_GENAI_USE_VERTEXAI=True
  3. Para ver el resultado, ejecuta el archivo de Python invocando el siguiente comando en la terminal del panel del editor de código:

/usr/bin/python3 /genai.py Nota: Si ves un error 400, intenta volver a ejecutar el código.

Explicación del código

  • El fragmento de código carga un modelo de IA previamente entrenado llamado Gemini (gemini-2.0-flash-001) en Vertex AI.
  • El código llama al método generate_content del modelo de Gemini cargado.
  • La entrada del método es un URI de imagen y una instrucción que contiene una pregunta sobre la imagen.
  • El código usa la capacidad de Gemini para comprender imágenes y texto en conjunto. Usa el texto proporcionado en la instrucción para describir el contenido de la imagen.

Compruébalo. Experimenta con diferentes URIs de imágenes y preguntas de instrucciones para explorar las capacidades de Gemini.

Haz clic en Revisar mi progreso para verificar el objetivo.

Generar contenido para la imagen

¡Felicitaciones!

Completaste el lab. ¡Felicitaciones!

Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.

Antes de comenzar

  1. Los labs crean un proyecto de Google Cloud y recursos por un tiempo determinado
  2. .
  3. Los labs tienen un límite de tiempo y no tienen la función de pausa. Si finalizas el lab, deberás reiniciarlo desde el principio.
  4. En la parte superior izquierda de la pantalla, haz clic en Comenzar lab para empezar

Usa la navegación privada

  1. Copia el nombre de usuario y la contraseña proporcionados para el lab
  2. Haz clic en Abrir la consola en modo privado

Accede a la consola

  1. Accede con tus credenciales del lab. Si usas otras credenciales, se generarán errores o se incurrirá en cargos.
  2. Acepta las condiciones y omite la página de recursos de recuperación
  3. No hagas clic en Finalizar lab, a menos que lo hayas terminado o quieras reiniciarlo, ya que se borrará tu trabajo y se quitará el proyecto

Este contenido no está disponible en este momento

Te enviaremos una notificación por correo electrónico cuando esté disponible

¡Genial!

Nos comunicaremos contigo por correo electrónico si está disponible

Un lab a la vez

Confirma para finalizar todos los labs existentes y comenzar este

Usa la navegación privada para ejecutar el lab

Usa una ventana de navegación privada o de Incógnito para ejecutar el lab. Así evitarás cualquier conflicto entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.