GSP1334
Visão geral
Imagine que você quer pesquisar um catálogo de imagens de produtos armazenadas
no Cloud Storage para determinar se um produto semelhante foi vendido no
passado. Para isso, use a pesquisa vetorial no BigQuery!
O BigQuery é
uma plataforma de dados totalmente gerenciada e pronta para IA que oferece
suporte à integração total de fontes de dados externas (como metadados de
imagens em um bucket do Cloud Storage) e conexões com modelos remotos para
pesquisa vetorial. Assim, é possível melhorar seus fluxos de trabalho de
análise de dados com a IA generativa.
A
pesquisa vetorial
é uma metodologia útil para encontrar itens semelhantes com base no
significado semântico, não na correspondência exata de palavra-chave. Ela pode
ser aplicada a vários tipos de dados, incluindo imagens, vídeos e texto. A
pesquisa vetorial usa embeddings, que são vetores numéricos de alta dimensão
que representam uma entidade, como texto ou uma imagem. Esses embeddings
codificam a semântica sobre essas entidades para facilitar a comparação. Isso
tem muitas aplicações, como a capacidade aprimorada de pesquisar vendas
históricas de itens semelhantes em um conjunto de dados de inventário ou
catálogo de imagens de produtos.
Com um nome ou uma descrição de produto, é possível usar a pesquisa vetorial
em uma tabela de objetos do BigQuery que contém metadados das imagens do
produto e identificar os produtos mais relacionados aos seus termos de
pesquisa. Esse fluxo de trabalho integra o poder da
Agent Platform
ao BigQuery para pesquisa vetorial, permitindo analisar dados multimodais
(incluindo imagens e texto) no BigQuery para extrair insights úteis,
melhorando assim as capacidades de tomada de decisão.
Neste laboratório, você vai aprender rapidamente como funciona a pesquisa
vetorial multimodal no BigQuery. Comece concedendo algumas permissões e
criando uma conexão com um modelo de embeddings no BigQuery. Em seguida, chame
o modelo para gerar uma tabela de embeddings e armazenar representações
vetoriais de imagens de produtos em um bucket do Cloud Storage. Por fim,
execute uma pesquisa vetorial nas imagens de produtos armazenadas no Cloud
Storage para identificar os produtos mais semelhantes aos seus termos de
pesquisa com base nos recursos e metadados da imagem.
Atividades deste laboratório
Neste laboratório, você aprenderá a fazer o seguinte:
-
Conceder papéis do Identity and Access Management (IAM) à conta de serviço
do BigQuery.
- Conectar-se a um modelo de embeddings remoto no BigQuery.
- Gerar embeddings e salvá-los em uma tabela no BigQuery.
-
Executar uma pesquisa vetorial nas imagens de produtos no Cloud Storage.
Configuração e requisitos
Antes de clicar no botão Começar o Laboratório
Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é ativado quando você clica em Iniciar laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.
Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, e não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.
Confira os requisitos para concluir o laboratório:
- Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima (recomendado) ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e de estudante, o que poderia causar cobranças extras na sua conta pessoal.
- Tempo para concluir o laboratório: não se esqueça que, depois de começar, não será possível pausar o laboratório.
Observação: use apenas a conta de estudante neste laboratório. Se usar outra conta do Google Cloud, você poderá receber cobranças nela.
Como iniciar seu laboratório e fazer login no console do Google Cloud
-
Clique no botão Começar o laboratório. Se for preciso pagar por ele, uma caixa de diálogo vai aparecer para você selecionar a forma de pagamento.
No painel Detalhes do Laboratório, à esquerda, você vai encontrar o seguinte:
- O botão Abrir Console do Google Cloud
- O tempo restante
- As credenciais temporárias que você vai usar neste laboratório
- Outras informações, se forem necessárias
-
Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima.
O laboratório ativa os recursos e depois abre a página Fazer Login em outra guia.
Dica: coloque as guias em janelas separadas lado a lado.
Observação: se aparecer a caixa de diálogo Escolher uma conta, clique em Usar outra conta.
-
Se necessário, copie o Nome de usuário abaixo e cole na caixa de diálogo Fazer login.
{{{user_0.username | "Username"}}}
Você também encontra o nome de usuário no painel Detalhes do Laboratório.
-
Clique em Próxima.
-
Copie a Senha abaixo e cole na caixa de diálogo de Olá.
{{{user_0.password | "Password"}}}
Você também encontra a senha no painel Detalhes do Laboratório.
-
Clique em Próxima.
Importante: você precisa usar as credenciais fornecidas no laboratório, e não as da sua conta do Google Cloud.
Observação: se você usar sua própria conta do Google Cloud neste laboratório, é possível que receba cobranças adicionais.
-
Acesse as próximas páginas:
- Aceite os Termos e Condições.
- Não adicione opções de recuperação nem autenticação de dois fatores (porque essa é uma conta temporária).
- Não se inscreva em testes gratuitos.
Depois de alguns instantes, o console do Google Cloud será aberto nesta guia.
Observação: para acessar os produtos e serviços do Google Cloud, clique no Menu de navegação ou digite o nome do serviço ou produto no campo Pesquisar.
Tarefa 1: conceder papéis do IAM à conta de serviço do BigQuery
Neste ambiente de laboratório, vários recursos foram pré-criados, incluindo
uma
conexão externa do BigQuery
chamada remote-models-connection e uma
tabela de objetos do BigQuery
chamada image_object_table. Com esses recursos, é possível
acessar e consultar dados não estruturados no Cloud Storage, como imagens.
Quando a conexão externa foi criada, uma conta de serviço do BigQuery também
foi gerada automaticamente e pode ser usada para controlar o acesso aos
recursos.
Nesta tarefa, conceda papéis específicos do IAM à conta de serviço do BigQuery
gerada automaticamente para acessar os arquivos de imagem no Cloud Storage e
os recursos da Agent Platform necessários para a pesquisa vetorial.
Abrir o console do BigQuery
- No Console do Google Cloud, selecione o menu de navegação > BigQuery:
Você verá a caixa de mensagem Olá! Este é o BigQuery no Console do Cloud. Ela tem um link para o guia de início rápido e as notas de lançamento.
- Clique em OK.
O console do BigQuery vai abrir.
Identificar a conta de serviço do BigQuery gerada automaticamente
-
Expanda a seta ao lado do ID do projeto () e, em seguida, a seta ao lado de Conexões.
-
Clique na conexão chamada
.remote-models-connection.
-
Na página Informações da conexão, copie o
ID da conta de serviço para uso na próxima etapa.
Por exemplo:
bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com
conceder papéis do IAM à conta de serviço do BigQuery
-
No console do Google Cloud, no Menu de navegação (
), selecione IAM e administrador >
IAM.
-
Clique em Conceder acesso.
-
Em Novos principais, insira o ID da conta de serviço que
você copiou na seção anterior (como
bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com).
-
Em Selecionar um papel, filtre por
Usuário da Agent Platform e selecione essa opção nos
resultados.
-
Clique em Adicionar outro papel.
-
Em Selecionar um papel, filtre por
Leitor de objetos do Storage e selecione essa opção nos
resultados.
-
Clique em Salvar.
Clique em Verificar meu progresso para conferir o objetivo.
Conceder papéis do IAM à conta de serviço do BigQuery
Tarefa 2: criar um modelo remoto do BigQuery
Agora que você concedeu os papéis necessários à conta de serviço do BigQuery,
é possível criar um
modelo remoto no BigQuery
para acessar funcionalidades da Agent Platform, como recursos de IA
generativa.
Nesta tarefa, você vai usar a conexão externa do BigQuery chamada
remote-models-connection para criar um modelo remoto chamado
embeddings_model que se conecta a um modelo de embeddings
disponível na Agent Platform. Como os dados de imagem são armazenados em um
bucket do Cloud Storage em um formato não estruturado, você quer designar um
modelo multimodal como o endpoint para processar esse tipo de dado de maneira
eficaz.
-
No console do Google Cloud, no menu de navegação (
), selecione BigQuery > Studio.
-
Na janela de consulta SQL, cole a consulta a seguir para criar o modelo
remoto do BigQuery no conjunto de dados products e clique
em Executar:
CREATE OR REPLACE MODEL
`{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`
REMOTE WITH CONNECTION `{{{project_0.project_id | filled in at lab start}}}.{{{project_0.startup_script.bq_gcp_region | "BigQuery location"}}}.remote-models-connection`
OPTIONS(
ENDPOINT = '{{{project_0.startup_script.multi_modal_embedding_id | Multimodal embeddings model}}}'
);
Observação: se você receber um erro relacionado às permissões da conta de serviço (que você atribuiu na tarefa anterior), aguarde alguns minutos e execute a consulta novamente.
Clique em Verificar meu progresso para conferir o objetivo.
Criar um modelo remoto do BigQuery
Tarefa 3: criar uma tabela de embeddings para imagens listadas em uma tabela
de objetos
Depois de criar um modelo remoto no BigQuery, a próxima etapa é chamar o
modelo para gerar os embeddings com base nos arquivos de imagem armazenados no
Cloud Storage. Como mencionado na Tarefa 1, uma
tabela de objetos
chamada image_object_table foi criada previamente para este
ambiente de laboratório e pode ser usada para consultar os arquivos de imagem.
Nesta tarefa, você vai chamar o modelo de embeddings para executar em
product_image_object_table e armazenar os resultados em uma
nova tabela chamada product_embeddings. Ao executar a
consulta, o BigQuery envia os dados na tabela de objetos para o
modelo de embeddings multimodais, que retorna os embeddings que podem ser usados para pesquisas vetoriais e
encontrar entidades semanticamente semelhantes.
-
Na janela de consulta SQL, execute a seguinte consulta para criar a tabela
de embeddings:
CREATE OR REPLACE TABLE `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`
AS SELECT *, REGEXP_EXTRACT(uri, r'[^/]+$') as product_name
FROM ML.GENERATE_EMBEDDING
(
MODEL `{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`,
TABLE `{{{project_0.project_id | filled in at lab start}}}.products.image_object_table`
);
-
Na janela de consulta SQL, execute a seguinte consulta para analisar os
dados na nova tabela de embeddings:
SELECT * FROM `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`;
Clique em Verificar meu progresso para conferir o objetivo.
Criar uma tabela de embeddings para imagens listadas em uma tabela de
objetos
Tarefa 4: executar uma pesquisa vetorial em imagens de produtos no Cloud
Storage
Conforme a visão geral deste laboratório, a
pesquisa vetorial
no BigQuery permite usar embeddings calculados (que são vetores numéricos)
para encontrar objetos semanticamente semelhantes. Especificamente, a pesquisa
vetorial usa métricas de distância que representam a distância entre vetores
em um espaço de embeddings para compará-los e classificá-los por similaridade.
No BigQuery, a função de pesquisa vetorial oferece suporte a três
tipos de distância, incluindo euclidiana (padrão), cosseno e produto escalar.
Nesta tarefa, você vai usar a similaridade de cossenos (que é o cosseno do
ângulo entre dois vetores) para identificar as três imagens de produtos mais
semelhantes no Google Cloud Storage a uma frase de pesquisa específica:
suéteres coloridos femininos.
-
Na janela de consulta SQL, execute a consulta a seguir, que usa a função
VECTOR_SEARCH para pesquisar na tabela de embeddings de
produtos e encontrar as imagens mais semelhantes ao termo de pesquisa
fornecido:
SELECT base.uri,
base.product_name,
base.content_type,
distance
FROM
VECTOR_SEARCH(TABLE products.product_embeddings,'ml_generate_embedding_result',
(
SELECT ml_generate_embedding_result AS embedding_col
FROM
ML.GENERATE_EMBEDDING
(
MODEL `products.embeddings_model`,
(SELECT 'colorful sweaters for women' AS content),
STRUCT(TRUE AS flatten_json_output)
)
),
TOP_K => 3,
DISTANCE_TYPE => 'COSINE'
);
Analise as imagens com maior correspondência no Cloud Storage
[Opcional] Para ver as imagens específicas que foram retornadas como as mais
correspondentes, acesse o bucket do Cloud Storage e abra cada imagem.
-
No console do Google Cloud, acesse o
menu de navegação (
) e selecione Cloud Storage > Buckets.
-
Clique no bucket chamado
e em um nome de imagem, como Onesie.jpg.
-
Clique no URL autenticado para ver a imagem (como
https://storage.cloud.google.com/qwiklabs-gcp-04-dc2812426125/Onesie.jpg).
Clique em Verificar meu progresso para conferir o objetivo.
Executar uma pesquisa vetorial em imagens de produtos no Cloud Storage
Parabéns!
Neste laboratório, você recebeu uma introdução rápida à pesquisa vetorial no
BigQuery e a usou para encontrar as imagens no Cloud Storage mais relacionadas
a um termo de pesquisa desejado.
Próximas etapas / Saiba mais
Treinamento e certificação do Google Cloud
Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.
Manual atualizado em 16 de março de 2026
Laboratório testado em 16 de março de 2026
Copyright 2026 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.