GSP1334
Visão geral
Imagine que você quer pesquisar um catálogo de imagens de produtos armazenadas no Cloud Storage para determinar se um produto semelhante foi vendido no passado. Para isso, use a pesquisa vetorial no BigQuery!
O BigQuery é uma plataforma de dados totalmente gerenciada e pronta para IA que oferece suporte à integração total de fontes de dados externas (como metadados de imagens em um bucket do Cloud Storage) e conexões com modelos remotos para pesquisa vetorial. Assim, é possível melhorar seus fluxos de trabalho de análise de dados com a IA generativa.
A pesquisa vetorial é uma metodologia útil para encontrar itens semelhantes com base no significado semântico, não na correspondência exata de palavra-chave. Ela pode ser aplicada a vários tipos de dados, incluindo imagens, vídeos e texto. A pesquisa vetorial usa embeddings, que são vetores numéricos de alta dimensão que representam uma entidade, como texto ou uma imagem. Esses embeddings codificam a semântica sobre essas entidades para facilitar a comparação. Isso tem muitas aplicações, como a capacidade aprimorada de pesquisar vendas históricas de itens semelhantes em um conjunto de dados de inventário ou catálogo de imagens de produtos.
Com um nome ou uma descrição de produto, é possível usar a pesquisa vetorial em uma tabela de objetos do BigQuery que contém metadados das imagens do produto e identificar os produtos mais relacionados aos seus termos de pesquisa. Esse fluxo de trabalho integra o poder da Vertex AI ao BigQuery para pesquisa vetorial, permitindo analisar dados multimodais (incluindo imagens e texto) no BigQuery para extrair insights úteis, melhorando assim as capacidades de tomada de decisão.
Neste laboratório, você vai aprender rapidamente como funciona a pesquisa vetorial multimodal no BigQuery. Comece concedendo algumas permissões e criando uma conexão com um modelo de embeddings no BigQuery. Em seguida, chame o modelo para gerar uma tabela de embeddings e armazenar representações vetoriais de imagens de produtos em um bucket do Cloud Storage. Por fim, execute uma pesquisa vetorial nas imagens de produtos armazenadas no Cloud Storage para identificar os produtos mais semelhantes aos seus termos de pesquisa com base nos recursos e metadados da imagem.
Atividades deste laboratório
Neste laboratório, você aprenderá a fazer o seguinte:
- Conceder papéis do Identity and Access Management (IAM) à conta de serviço do BigQuery.
- Conectar-se a um modelo de embeddings remoto no BigQuery.
- Gerar embeddings e salvá-los em uma tabela no BigQuery.
- Executar uma pesquisa vetorial nas imagens de produtos no Cloud Storage.
Configuração e requisitos
Antes de clicar no botão Começar o Laboratório
Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é ativado quando você clica em Iniciar laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.
Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, e não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.
Confira os requisitos para concluir o laboratório:
- Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima (recomendado) ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e de estudante, o que poderia causar cobranças extras na sua conta pessoal.
- Tempo para concluir o laboratório: não se esqueça que, depois de começar, não será possível pausar o laboratório.
Observação: use apenas a conta de estudante neste laboratório. Se usar outra conta do Google Cloud, você poderá receber cobranças nela.
Como iniciar seu laboratório e fazer login no console do Google Cloud
-
Clique no botão Começar o laboratório. Se for preciso pagar por ele, uma caixa de diálogo vai aparecer para você selecionar a forma de pagamento.
No painel Detalhes do Laboratório, à esquerda, você vai encontrar o seguinte:
- O botão Abrir Console do Google Cloud
- O tempo restante
- As credenciais temporárias que você vai usar neste laboratório
- Outras informações, se forem necessárias
-
Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima.
O laboratório ativa os recursos e depois abre a página Fazer Login em outra guia.
Dica: coloque as guias em janelas separadas lado a lado.
Observação: se aparecer a caixa de diálogo Escolher uma conta, clique em Usar outra conta.
-
Se necessário, copie o Nome de usuário abaixo e cole na caixa de diálogo Fazer login.
{{{user_0.username | "Username"}}}
Você também encontra o nome de usuário no painel Detalhes do Laboratório.
-
Clique em Próxima.
-
Copie a Senha abaixo e cole na caixa de diálogo de Olá.
{{{user_0.password | "Password"}}}
Você também encontra a senha no painel Detalhes do Laboratório.
-
Clique em Próxima.
Importante: você precisa usar as credenciais fornecidas no laboratório, e não as da sua conta do Google Cloud.
Observação: se você usar sua própria conta do Google Cloud neste laboratório, é possível que receba cobranças adicionais.
-
Acesse as próximas páginas:
- Aceite os Termos e Condições.
- Não adicione opções de recuperação nem autenticação de dois fatores (porque essa é uma conta temporária).
- Não se inscreva em testes gratuitos.
Depois de alguns instantes, o console do Google Cloud será aberto nesta guia.
Observação: para acessar os produtos e serviços do Google Cloud, clique no Menu de navegação ou digite o nome do serviço ou produto no campo Pesquisar.
Tarefa 1: conceder papéis do IAM à conta de serviço do BigQuery
Neste ambiente de laboratório, vários recursos foram pré-criados, incluindo uma conexão externa do BigQuery chamada remote-models-connection e uma tabela de objetos do BigQuery chamada image_object_table. Com esses recursos, é possível acessar e consultar dados não estruturados no Cloud Storage, como imagens. Quando a conexão externa foi criada, uma conta de serviço do BigQuery também foi gerada automaticamente e pode ser usada para controlar o acesso aos recursos.
Nesta tarefa, conceda papéis específicos do IAM à conta de serviço do BigQuery gerada automaticamente para acessar os arquivos de imagem no Cloud Storage e os recursos da Vertex AI necessários para a pesquisa vetorial.
Abrir o console do BigQuery
- No Console do Google Cloud, selecione o menu de navegação > BigQuery:
Você verá a caixa de mensagem Olá! Este é o BigQuery no Console do Cloud. Ela tem um link para o guia de início rápido e as notas de lançamento.
- Clique em OK.
O console do BigQuery vai abrir.
Identificar a conta de serviço do BigQuery gerada automaticamente
-
Expanda a seta ao lado do ID do projeto () e, em seguida, a seta ao lado de Conexões.
-
Clique na conexão chamada .remote-models-connection.
-
Na página Informações da conexão, copie o ID da conta de serviço para uso na próxima etapa.
Por exemplo: bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com
conceder papéis do IAM à conta de serviço do BigQuery
-
No console do Google Cloud, no Menu de navegação (
), selecione IAM e administrador > IAM.
-
Clique em Conceder acesso.
-
Em Novos principais, insira o ID da conta de serviço que você copiou na seção anterior (como bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com).
-
Em Selecionar um papel, filtre por Usuário da Vertex AI e selecione essa opção nos resultados.
-
Clique em Adicionar outro papel.
-
Em Selecionar um papel, filtre por Leitor de objetos do Storage e selecione essa opção nos resultados.
-
Clique em Salvar.
Clique em Verificar meu progresso para conferir o objetivo.
Conceder papéis do IAM à conta de serviço do BigQuery
Tarefa 2: criar um modelo remoto do BigQuery
Agora que você concedeu os papéis necessários à conta de serviço do BigQuery, é possível criar um modelo remoto no BigQuery para acessar funcionalidades da Vertex AI, como recursos de IA generativa.
Nesta tarefa, você vai usar a conexão externa do BigQuery chamada remote-models-connection para criar um modelo remoto chamado embeddings_model que se conecta a um modelo de embeddings disponível na Vertex AI. Como os dados de imagem são armazenados em um bucket do Cloud Storage em um formato não estruturado, você quer designar um modelo multimodal como o endpoint para processar esse tipo de dado de maneira eficaz.
-
No console do Google Cloud, no menu de navegação (
), selecione BigQuery > Studio.
-
Na janela de consulta SQL, cole a consulta a seguir para criar o modelo remoto do BigQuery no conjunto de dados products e clique em Executar:
CREATE OR REPLACE MODEL
`{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`
REMOTE WITH CONNECTION `{{{project_0.project_id | filled in at lab start}}}.{{{project_0.startup_script.bq_gcp_region | "BigQuery location"}}}.remote-models-connection`
OPTIONS(
ENDPOINT = '{{{project_0.startup_script.multi_modal_embedding_id | Multimodal embeddings model}}}'
);
Observação: se você receber um erro relacionado às permissões da conta de serviço (que você atribuiu na tarefa anterior), aguarde alguns minutos e execute a consulta novamente.
Clique em Verificar meu progresso para conferir o objetivo.
Criar um modelo remoto do BigQuery
Tarefa 3: criar uma tabela de embeddings para imagens listadas em uma tabela de objetos
Depois de criar um modelo remoto no BigQuery, a próxima etapa é chamar o modelo para gerar os embeddings com base nos arquivos de imagem armazenados no Cloud Storage. Como mencionado na Tarefa 1, uma tabela de objetos chamada image_object_table foi criada previamente para este ambiente de laboratório e pode ser usada para consultar os arquivos de imagem.
Nesta tarefa, você vai chamar o modelo de embeddings para executar em product_image_object_table e armazenar os resultados em uma nova tabela chamada product_embeddings. Ao executar a consulta, o BigQuery envia os dados na tabela de objetos para o modelo de embeddings multimodais, que retorna os embeddings que podem ser usados para pesquisas vetoriais e encontrar entidades semanticamente semelhantes.
- Na janela de consulta SQL, execute a seguinte consulta para criar a tabela de embeddings:
CREATE OR REPLACE TABLE `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`
AS SELECT *, REGEXP_EXTRACT(uri, r'[^/]+$') as product_name
FROM ML.GENERATE_EMBEDDING
(
MODEL `{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`,
TABLE `{{{project_0.project_id | filled in at lab start}}}.products.image_object_table`
);
- Na janela de consulta SQL, execute a seguinte consulta para analisar os dados na nova tabela de embeddings:
SELECT * FROM `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`;
Clique em Verificar meu progresso para conferir o objetivo.
Criar uma tabela de embeddings para imagens listadas em uma tabela de objetos
Tarefa 4: executar uma pesquisa vetorial em imagens de produtos no Cloud Storage
Conforme a visão geral deste laboratório, a pesquisa vetorial no BigQuery permite usar embeddings calculados (que são vetores numéricos) para encontrar objetos semanticamente semelhantes. Especificamente, a pesquisa vetorial usa métricas de distância que representam a distância entre vetores em um espaço de embeddings para compará-los e classificá-los por similaridade. No BigQuery, a função de pesquisa vetorial oferece suporte a três tipos de distância, incluindo euclidiana (padrão), cosseno e produto escalar.
Nesta tarefa, você vai usar a similaridade de cossenos (que é o cosseno do ângulo entre dois vetores) para identificar as três imagens de produtos mais semelhantes no Google Cloud Storage a uma frase de pesquisa específica: suéteres coloridos femininos.
- Na janela de consulta SQL, execute a consulta a seguir, que usa a função
VECTOR_SEARCH para pesquisar na tabela de embeddings de produtos e encontrar as imagens mais semelhantes ao termo de pesquisa fornecido:
SELECT base.uri,
base.product_name,
base.content_type,
distance
FROM
VECTOR_SEARCH(TABLE products.product_embeddings,'ml_generate_embedding_result',
(
SELECT ml_generate_embedding_result AS embedding_col
FROM
ML.GENERATE_EMBEDDING
(
MODEL `products.embeddings_model`,
(SELECT 'colorful sweaters for women' AS content),
STRUCT(TRUE AS flatten_json_output)
)
),
TOP_K => 3,
DISTANCE_TYPE => 'COSINE'
);
Analise as imagens com maior correspondência no Cloud Storage
[Opcional] Para ver as imagens específicas que foram retornadas como as mais correspondentes, acesse o bucket do Cloud Storage e abra cada imagem.
-
No console do Google Cloud, acesse o menu de navegação (
) e selecione Cloud Storage > Buckets.
-
Clique no bucket chamado e em um nome de imagem, como Onesie.jpg.
-
Clique no URL autenticado para ver a imagem (como https://storage.cloud.google.com/qwiklabs-gcp-04-dc2812426125/Onesie.jpg).
Clique em Verificar meu progresso para conferir o objetivo.
Executar uma pesquisa vetorial em imagens de produtos no Cloud Storage
Parabéns!
Neste laboratório, você recebeu uma introdução rápida à pesquisa vetorial no BigQuery e a usou para encontrar as imagens no Cloud Storage mais relacionadas a um termo de pesquisa desejado.
Próximas etapas / Saiba mais
Treinamento e certificação do Google Cloud
Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.
Manual atualizado em 16 de março de 2026
Laboratório testado em 16 de março de 2026
Copyright 2026 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.