Instruções e requisitos de configuração do laboratório

Proteja sua conta e seu progresso. Sempre use uma janela anônima do navegador e suas credenciais para realizar este laboratório.

Criar um aplicativo de RAG com o BigQuery

Laboratório 1 hora universal_currency_alt 5 créditos show_chart Intermediário

info Este laboratório pode incorporar ferramentas de IA para ajudar no seu aprendizado.

GSP1289
Visão geral
Configuração e requisitos
Tarefa 1: criar uma conexão de origem e conceder permissões do IAM
Tarefa 2: gerar embeddings
Tarefa 3: pesquisar o espaço vetorial e recuperar itens semelhantes
Tarefa 4: gerar uma resposta melhor
Parabéns!

Este conteúdo ainda não foi otimizado para dispositivos móveis.

Para aproveitar a melhor experiência, acesse nosso site em um computador desktop usando o link enviado a você por e-mail.

GSP1289

Logotipo dos laboratórios autoguiados do Google Cloud

Visão geral

As alucinações da IA preocupam você? Embora a IA possa ser um recurso valioso, às vezes ela gera respostas imprecisas, desatualizadas ou muito gerais, um fenômeno conhecido como "alucinação". Neste laboratório, você vai aprender a implementar um pipeline de geração aumentada de recuperação (RAG) para resolver esse problema. A RAG melhora os modelos de linguagem grandes (LLMs) como o Gemini ao embasar a saída deles em informações contextualmente relevantes de um conjunto de dados específico.

Imagine que você está ajudando a Coffee-on-Wheels, uma pioneira vendedora móvel de café, a analisar o feedback dos clientes sobre os serviços. Sem acesso aos dados mais recentes, as respostas do Gemini podem ser imprecisas. Para resolver esse problema, você decide criar um pipeline de RAG que inclui três etapas:

Gerar embeddings: converta o texto do feedback do cliente em embeddings de vetor, que são representações numéricas de dados que capturam o significado semântico.
Pesquisar espaço vetorial: crie um índice desses vetores, pesquise e recupere itens semelhantes.
Gerar respostas melhores: adicione as informações recuperadas ao Gemini para produzir respostas mais precisas e relevantes.

O BigQuery permite fácil conexão com modelos de IA generativa remotos na Vertex AI. Ele também oferece várias funções para embeddings, pesquisa vetorial e geração de texto diretamente por consultas SQL ou notebooks Python.

Para saber mais, confira o curso Criar embeddings, pesquisa vetorial e RAG com o BigQuery no Google Cloud Ensina.

O que você vai aprender

Criar uma conexão de origem e conceder permissões do IAM.
Gerar embeddings e converter dados de texto em embeddings de vetor.
Pesquisar o espaço vetorial e recuperar itens semelhantes.
Gerar uma resposta melhor ao aprimorar o Gemini com os resultados da pesquisa.

Pré-requisitos

Para concluir este laboratório, você precisa conhecer o BigQuery e a programação em SQL.

Configuração e requisitos

Antes de clicar no botão Começar o Laboratório

Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é ativado quando você clica em Iniciar laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.

Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, e não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.

Confira os requisitos para concluir o laboratório:

Acesso a um navegador de Internet padrão (recomendamos o Chrome).

Observação: para executar este laboratório, use o modo de navegação anônima (recomendado) ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e de estudante, o que poderia causar cobranças extras na sua conta pessoal.

Tempo para concluir o laboratório: não se esqueça que, depois de começar, não será possível pausar o laboratório.

Observação: use apenas a conta de estudante neste laboratório. Se usar outra conta do Google Cloud, você poderá receber cobranças nela.

Como iniciar seu laboratório e fazer login no console do Google Cloud

Clique no botão Começar o laboratório. Se for preciso pagar por ele, uma caixa de diálogo vai aparecer para você selecionar a forma de pagamento. No painel Detalhes do Laboratório, à esquerda, você vai encontrar o seguinte:
- O botão Abrir Console do Google Cloud
- O tempo restante
- As credenciais temporárias que você vai usar neste laboratório
- Outras informações, se forem necessárias
Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima.

O laboratório ativa os recursos e depois abre a página Fazer Login em outra guia.

Dica: coloque as guias em janelas separadas lado a lado.
Observação: se aparecer a caixa de diálogo Escolher uma conta, clique em Usar outra conta.
Se necessário, copie o Nome de usuário abaixo e cole na caixa de diálogo Fazer login.
{{{user_0.username | "Username"}}}
Você também encontra o nome de usuário no painel Detalhes do Laboratório.
Clique em Próxima.
Copie a Senha abaixo e cole na caixa de diálogo de Olá.
{{{user_0.password | "Password"}}}
Você também encontra a senha no painel Detalhes do Laboratório.
Clique em Próxima.
Importante: você precisa usar as credenciais fornecidas no laboratório, e não as da sua conta do Google Cloud. Observação: se você usar sua própria conta do Google Cloud neste laboratório, é possível que receba cobranças adicionais.
Acesse as próximas páginas:
- Aceite os Termos e Condições.
- Não adicione opções de recuperação nem autenticação de dois fatores (porque essa é uma conta temporária).
- Não se inscreva em testes gratuitos.

Depois de alguns instantes, o console do Google Cloud será aberto nesta guia.

Observação: para acessar os produtos e serviços do Google Cloud, clique no Menu de navegação ou digite o nome do serviço ou produto no campo Pesquisar. Ícone do menu de navegação e campo de pesquisa

Ícone do menu de navegação e campo de pesquisa

Tarefa 1: criar uma conexão de origem e conceder permissões do IAM

Criar uma conexão de origem

Para usar modelos de IA generativa remotos na Vertex AI no BigQuery, como o Gemini e um modelo de embedding, crie uma nova conexão de origem externa.

No console do Google Cloud, acesse o menu de navegação () e clique em BigQuery.
Acesse o Explorador, clique em + Adicionar e selecione Conexões com fontes de dados externas.

Observação: se a opção + Adicionar seguida de Conexão com fontes de dados externas não aparecer, clique em + Adicionar dados e use a barra de pesquisa de fontes de dados para procurar a Vertex AI. Clique no resultado Vertex AI > Federação do BigQuery.

Em Tipo de conexão, selecione Modelos remotos da Vertex AI, funções remotas, BigLake e Spanner (recurso do Cloud).
No campo ID da conexão, digite embedding_conn.
Clique em Criar conexão.
Depois de criar a conexão, clique em Ir para a conexão no pop-up de confirmação para acessar a conexão e copiar o valor do ID da conta de serviço. Você vai precisar dele mais tarde para atribuir permissões à conta.

Conceder permissões do IAM

Para usar os dados do BigQuery e os recursos da Vertex AI, conceda as permissões do IAM necessárias à conta de serviço.

Em seguida, você precisa conceder permissões pelo IAM. Siga as etapas a seguir:
- No console do Google Cloud, acesse o Menu de navegação () e selecione IAM e administrador > IAM.
- Clique em Conceder acesso.
- Na seção Adicionar principais:
  - No campo de texto Novos principais, cole o valor ID da conta de serviço que você copiou anteriormente.
  - Em Atribuir função, selecione as seguintes funções (procure-as se necessário):
    - Proprietário de dados do BigQuery
    - Usuário da Vertex AI
Clique em Salvar para aplicar as alterações.
Acesse APIs e serviços no Menu de navegação (), clique em + Ativar APIs e serviços, pesquise API Vertex AI e clique em Ativar.

Clique em Verificar meu progresso para conferir o objetivo. Criar uma conexão com uma fonte e conceder permissões do IAM.

Tarefa 2: gerar embeddings

No console do Google Cloud, no Menu de navegação (), acesse o BigQuery.
No Explorer, acesse os três pontos ao lado do projeto e clique em Criar conjunto de dados. Em ID do conjunto de dados, insira CustomerReview. Mantenha a outra opção padrão e clique em Criar conjunto de dados.
Para se conectar ao modelo de embedding, execute a seguinte consulta SQL no editor de consultas:

CREATE OR REPLACE MODEL `CustomerReview.Embeddings` REMOTE WITH CONNECTION `us.embedding_conn` OPTIONS (ENDPOINT = '{{{project_0.startup_script.gemini_embedding_model_id | Gemini Embedding model ID | disablehighlight}}}');

Para fazer upload do conjunto de dados de um arquivo CSV, execute a seguinte consulta SQL:

LOAD DATA OVERWRITE CustomerReview.customer_reviews ( customer_review_id INT64, customer_id INT64, location_id INT64, review_datetime DATETIME, review_text STRING, social_media_source STRING, social_media_handle STRING ) FROM FILES ( format = 'CSV', uris = ['gs://spls/gsp1249/customer_reviews.csv'] );

(Opcional) Para conferir os dados enviados na tabela, clique em Ir para a tabela. Encontre o esquema da tabela e visualize os dados.
Para gerar embeddings com base no feedback recente dos clientes e armazená-los em uma tabela, execute a seguinte consulta SQL no editor de consultas:

CREATE OR REPLACE TABLE `CustomerReview.customer_reviews_embedded` AS SELECT * FROM ML.GENERATE_EMBEDDING( MODEL `CustomerReview.Embeddings`, (SELECT review_text AS content FROM `CustomerReview.customer_reviews`) );

(Opcional) Para analisar os resultados de embedding, clique em Ir para a tabela. Encontre o esquema da tabela e visualize os dados. Os resultados de embedding são números de ponto flutuante e podem não ser imediatamente interpretáveis.

Clique em Verificar meu progresso para conferir o objetivo. Gerar embeddings.

Tarefa 3: pesquisar o espaço vetorial e recuperar itens semelhantes

Para criar um índice do espaço de pesquisa vetorial, execute a seguinte consulta SQL:

Observação: para conjuntos de dados com menos de 5.000 linhas, como neste laboratório, não é necessário criar um índice. Esta etapa demonstra o código necessário para criar um índice de espaço vetorial quando necessário para conjuntos de dados maiores.

CREATE OR REPLACE VECTOR INDEX `CustomerReview.reviews_index` ON `CustomerReview.customer_reviews_embedded`(ml_generate_embedding_result) OPTIONS (distance_type = 'COSINE', index_type = 'IVF');

Para pesquisar o espaço vetorial e recuperar os itens semelhantes, execute a seguinte consulta SQL:

CREATE OR REPLACE TABLE `CustomerReview.vector_search_result` AS SELECT query.query, base.content FROM VECTOR_SEARCH( TABLE `CustomerReview.customer_reviews_embedded`, 'ml_generate_embedding_result', ( SELECT ml_generate_embedding_result, content AS query FROM ML.GENERATE_EMBEDDING( MODEL `CustomerReview.Embeddings`, (SELECT 'service' AS content) ) ), top_k => 5, options => '{"fraction_lists_to_search": 0.01}' );

(Opcional) Para conferir os resultados da consulta, clique em Ir para a tabela. Encontre o esquema da tabela e visualize os dados.

Clique em Verificar meu progresso para conferir o objetivo. Pesquisar o espaço vetorial e recuperar itens semelhantes.

Tarefa 4: gerar uma resposta melhor

Para se conectar ao modelo do Gemini, execute a seguinte consulta SQL:
CREATE OR REPLACE MODEL `CustomerReview.Gemini` REMOTE WITH CONNECTION `us.embedding_conn` OPTIONS (ENDPOINT = '{{{project_0.startup_script.gemini_flash_model_id | Gemini Model ID | disablehighlight}}}');
Para melhorar as respostas do Gemini, forneça dados relevantes e recentes recuperados da pesquisa vetorial executando esta consulta:

SELECT ml_generate_text_llm_result AS generated FROM ML.GENERATE_TEXT( MODEL `CustomerReview.Gemini`, ( SELECT CONCAT( 'Summarize what customers think about our services', STRING_AGG(FORMAT('review text: %s', base.content), ',\n') ) AS prompt FROM `CustomerReview.vector_search_result` AS base ), STRUCT( 0.4 AS temperature, 300 AS max_output_tokens, 0.5 AS top_p, 5 AS top_k, TRUE AS flatten_json_output ) );

Confira os resultados gerados pelo Gemini na seção Resultados da consulta abaixo do editor de consultas.

Perguntas para você:
1. Como você determina se o Gemini gera respostas melhores com a RAG do que sem ela? Teste com código.

2. Como melhorar o código? Por exemplo, em vez de salvar os resultados da pesquisa vetorial em uma tabela (Tarefa 3), esse processo pode ser incorporado diretamente à geração de respostas (Tarefa 4) para recuperação em tempo real?

Use o tempo restante do laboratório para responder a essas perguntas. Boa sorte!

Clique em Verificar meu progresso para conferir o objetivo. Gerar a resposta melhorada com os dados recuperados da pesquisa vetorial.

Parabéns!

Para ajudar a Coffee-on-Wheels a receber insights com o feedback dos clientes sobre os serviços, você implementou um pipeline de RAG no BigQuery, dando ao Gemini informações relevantes e atualizadas. Você se conectou a modelos remotos de IA generativa, incluindo um modelo de embedding e o Gemini, e seguiu três etapas: criar embeddings, pesquisar um espaço vetorial e gerar uma resposta melhorada. O objetivo é permitir que você aplique a mesma abordagem para resolver seus próprios desafios de alucinação de IA.

Treinamento e certificação do Google Cloud

Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.

Manual atualizado em 17 de outubro de 2025

Laboratório testado em 17 de outubro de 2025

Copyright 2025 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.

Criar um aplicativo de RAG com o BigQuery

GSP1289

Visão geral

O que você vai aprender

Pré-requisitos

Configuração e requisitos

Antes de clicar no botão Começar o Laboratório

Como iniciar seu laboratório e fazer login no console do Google Cloud

Tarefa 1: criar uma conexão de origem e conceder permissões do IAM

Criar uma conexão de origem

Conceder permissões do IAM

Tarefa 2: gerar embeddings

Tarefa 3: pesquisar o espaço vetorial e recuperar itens semelhantes

Tarefa 4: gerar uma resposta melhor

Parabéns!

Treinamento e certificação do Google Cloud

Antes de começar

Usar a navegação anônima

Fazer login no console

Use a navegação anônima para executar o laboratório