Criar um aplicativo de IA generativa multimodal: laboratório com desafio
Laboratório
20 minutos
universal_currency_alt
Sem custo financeiro
show_chart
Introdutório
info
Este laboratório pode incorporar ferramentas de IA para ajudar no seu aprendizado.
Acesse mais de 700 laboratórios e cursos

Visão geral
Nos laboratórios com desafio, apresentamos uma situação e um conjunto de tarefas. Para concluí-las, em vez de seguir instruções detalhadas, você usará o que aprendeu nos laboratórios do curso. Um sistema automático de pontuação (mostrado nesta página) vai avaliar seu desempenho.
Nos laboratórios com desafio, não ensinamos novos conceitos do Google Cloud. O objetivo dessas tarefas é aprimorar aquilo que você já aprendeu, como a alteração de valores padrão ou a leitura e pesquisa de mensagens para corrigir seus próprios erros.
Para alcançar a pontuação de 100%, você precisa concluir todas as tarefas no tempo definido. Tudo pronto para começar o desafio?
- Os laboratórios são cronometrados e não podem ser pausados. O timer começa quando você clica em Iniciar laboratório.
- O terminal de nuvem incluído já vem pré-configurado com o SDK gcloud.
- Use o terminal para executar comandos e clique em Verificar meu progresso para conferir seu trabalho.
Cenário do desafio
Cenário: você é desenvolvedor em uma empresa de design de buquês com tecnologia de IA. Seus clientes descrevem o buquê dos sonhos, e seu sistema gera imagens realistas para aprovação. Para melhorar ainda mais a experiência, você está integrando uma análise de imagens de ponta para fornecer resumos descritivos dos buquês gerados. O aplicativo principal vai invocar os métodos relevantes com base na interação dos usuários. Para facilitar isso, conclua as tarefas abaixo:
Tarefa 1: desenvolva uma função do Python chamada generate_bouquet_image(prompt)
. Essa função precisa invocar o modelo imagen-3.0-generate-002
usando o prompt
fornecido, gerar a imagem e armazená-la localmente. Para este desafio, use o comando: Create an image containing a bouquet of 2 sunflowers and 3 roses
.
Clique em Verificar meu progresso para conferir o objetivo.
Gerar uma imagem enviando um comando em texto
Tarefa 2: desenvolva uma segunda função do Python chamada analyze_bouquet_image(image_path)
. Essa função usa o caminho da imagem como entrada, além de um comando de texto para gerar mensagens de aniversário com base na imagem enviada e enviá-las ao modelo gemini-2.0-flash-001
. Para garantir que as respostas sejam obtidas conforme são geradas, ative o streaming nas solicitações de comandos.
Clique em Verificar meu progresso para conferir o objetivo.
Analisar a imagem salva usando um modelo multimodal
Parabéns!
Você concluiu o laboratório. Parabéns!
Copyright 2025 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.