Crie um app de reconhecimento de imagens de IA usando o Gemini na Vertex AI
Laboratório
15 minutos
universal_currency_alt
Sem custo financeiro
show_chart
Introdutório
info
Este laboratório pode incorporar ferramentas de IA para ajudar no seu aprendizado.
Acesse mais de 700 laboratórios e cursos

Visão geral
- Os laboratórios são cronometrados e não podem ser pausados. O timer começa quando você clica em Iniciar laboratório.
- O terminal de nuvem incluído já vem pré-configurado com o SDK gcloud.
- Use o terminal para executar comandos e clique em Verificar meu progresso para conferir seu trabalho.
Objetivo
A IA generativa na Vertex AI (também conhecida como genAI ou gen AI) disponibiliza os grandes modelos de IA generativa do Google para você testar, ajustar e implantar nos seus aplicativos com tecnologia de IA. Neste laboratório, você vai:
-
Conectar-se à Vertex AI (plataforma de IA do Google Cloud): saiba como estabelecer uma conexão com os serviços de IA do Google usando o SDK da Vertex AI.
-
Carregar um modelo de IA generativa pré-treinado, o Gemini: descubra como usar um modelo de IA pré-treinado e avançado sem precisar criar um do zero.
-
Enviar perguntas com imagens e texto para o modelo de IA: entenda como fornecer entradas para a IA processar.
-
Extrair respostas baseadas em texto da IA: aprenda a lidar com as respostas de texto geradas pelo modelo de IA e a interpretá-las.
-
Entender os conceitos básicos da criação de aplicativos de IA: descubra os principais conceitos da integração da IA em projetos de software.
Como trabalhar com o SDK da Vertex AI para Python
Depois de iniciar o laboratório, você vai ver um painel dividido com o editor de código à esquerda e as instruções do laboratório à direita. Siga estas etapas para interagir com as APIs de IA generativa usando o SDK da Vertex AI para Python.
- Clique em Arquivo > Novo arquivo para abrir um novo arquivo no editor de código.
- Copie e cole o snippet de código fornecido no seu arquivo.
from google import genai
from google.genai.types import HttpOptions, Part
client = genai.Client(http_options=HttpOptions(api_version="v1"))
response = client.models.generate_content(
model="gemini-2.0-flash-001",
contents=[
"What is shown in this image?",
Part.from_uri(
file_uri="https://storage.googleapis.com/cloud-samples-data/generative-ai/image/scones.jpg",
mime_type="image/jpeg",
),
],
)
print(response.text)
-
Clique em Arquivo > Salvar, insira genai.py no campo Nome e clique em Salvar.
-
Para definir as variáveis de ambiente no novo terminal, execute o seguinte comando:
export GOOGLE_CLOUD_PROJECT='{{{ project_0.project_id | "project-id" }}}'
export GOOGLE_CLOUD_LOCATION='{{{ project_0.default_region | "REGION" }}}'
export GOOGLE_GENAI_USE_VERTEXAI=True
-
Execute o arquivo Python digitando o comando abaixo no terminal dentro do painel do editor de código para visualizar a saída.
/usr/bin/python3 /genai.py
Observação: se você encontrar um erro 400, tente executar o código novamente.
Explicação do código
- O snippet de código está carregando um modelo de IA pré-treinado chamado Gemini (gemini-2.0-flash-001) na Vertex AI.
- O código chama o método
generate_content do modelo Gemini carregado.
- A entrada do método é um URI de imagem e um comando que contém uma pergunta sobre a imagem.
- O código usa a capacidade do Gemini de entender imagens e texto juntos. Ele usa o texto fornecido no comando para descrever o conteúdo da imagem.
Faça um teste! Teste diferentes URIs de imagens e perguntas de comando para conhecer os recursos do Gemini.
Clique em Verificar meu progresso para conferir o objetivo.
Gerar conteúdo para a imagem
Parabéns!
Você concluiu o laboratório. Parabéns!
Copyright 2025 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.