GSP1289

Visão geral
As alucinações da IA preocupam você? Embora a IA possa ser um recurso valioso, às vezes ela gera respostas imprecisas, desatualizadas ou muito gerais, um fenômeno conhecido como "alucinação". Neste laboratório, você vai aprender a implementar um pipeline de geração aumentada de recuperação (RAG) para resolver esse problema. A RAG melhora os modelos de linguagem grandes (LLMs) como o Gemini ao embasar a saída deles em informações contextualmente relevantes de um conjunto de dados específico.
Imagine que você está ajudando a Coffee-on-Wheels, uma pioneira vendedora móvel de café, a analisar o feedback dos clientes sobre os serviços. Sem acesso aos dados mais recentes, as respostas do Gemini podem ser imprecisas. Para resolver esse problema, você decide criar um pipeline de RAG que inclui três etapas:
-
Gerar embeddings: converta o texto do feedback do cliente em embeddings de vetor, que são representações numéricas de dados que capturam o significado semântico.
-
Pesquisar espaço vetorial: crie um índice desses vetores, pesquise e recupere itens semelhantes.
-
Gerar respostas melhores: adicione as informações recuperadas ao Gemini para produzir respostas mais precisas e relevantes.
O BigQuery permite fácil conexão com modelos de IA generativa remotos na Vertex AI. Ele também oferece várias funções para embeddings, pesquisa vetorial e geração de texto diretamente por consultas SQL ou notebooks Python.
Para saber mais, confira o curso Criar embeddings, pesquisa vetorial e RAG com o BigQuery no Google Cloud Ensina.
O que você vai aprender
- Criar uma conexão de origem e conceder permissões do IAM.
- Gerar embeddings e converter dados de texto em embeddings de vetor.
- Pesquisar o espaço vetorial e recuperar itens semelhantes.
- Gerar uma resposta melhor ao aprimorar o Gemini com os resultados da pesquisa.
Pré-requisitos
Para concluir este laboratório, você precisa conhecer o BigQuery e a programação em SQL.
Configuração e requisitos
Antes de clicar no botão Começar o Laboratório
Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é ativado quando você clica em Iniciar laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.
Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, e não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.
Confira os requisitos para concluir o laboratório:
- Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima (recomendado) ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e de estudante, o que poderia causar cobranças extras na sua conta pessoal.
- Tempo para concluir o laboratório: não se esqueça que, depois de começar, não será possível pausar o laboratório.
Observação: use apenas a conta de estudante neste laboratório. Se usar outra conta do Google Cloud, você poderá receber cobranças nela.
Como iniciar seu laboratório e fazer login no console do Google Cloud
-
Clique no botão Começar o laboratório. Se for preciso pagar por ele, uma caixa de diálogo vai aparecer para você selecionar a forma de pagamento.
No painel Detalhes do Laboratório, à esquerda, você vai encontrar o seguinte:
- O botão Abrir Console do Google Cloud
- O tempo restante
- As credenciais temporárias que você vai usar neste laboratório
- Outras informações, se forem necessárias
-
Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima.
O laboratório ativa os recursos e depois abre a página Fazer Login em outra guia.
Dica: coloque as guias em janelas separadas lado a lado.
Observação: se aparecer a caixa de diálogo Escolher uma conta, clique em Usar outra conta.
-
Se necessário, copie o Nome de usuário abaixo e cole na caixa de diálogo Fazer login.
{{{user_0.username | "Username"}}}
Você também encontra o nome de usuário no painel Detalhes do Laboratório.
-
Clique em Próxima.
-
Copie a Senha abaixo e cole na caixa de diálogo de Olá.
{{{user_0.password | "Password"}}}
Você também encontra a senha no painel Detalhes do Laboratório.
-
Clique em Próxima.
Importante: você precisa usar as credenciais fornecidas no laboratório, e não as da sua conta do Google Cloud.
Observação: se você usar sua própria conta do Google Cloud neste laboratório, é possível que receba cobranças adicionais.
-
Acesse as próximas páginas:
- Aceite os Termos e Condições.
- Não adicione opções de recuperação nem autenticação de dois fatores (porque essa é uma conta temporária).
- Não se inscreva em testes gratuitos.
Depois de alguns instantes, o console do Google Cloud será aberto nesta guia.
Observação: para acessar os produtos e serviços do Google Cloud, clique no Menu de navegação ou digite o nome do serviço ou produto no campo Pesquisar.
Tarefa 1: criar uma conexão de origem e conceder permissões do IAM
Criar uma conexão de origem
Para usar modelos de IA generativa remotos na Vertex AI no BigQuery, como o Gemini e um modelo de embedding, crie uma nova conexão de origem externa.
- No console do Google Cloud, acesse o menu de navegação (
) e clique em BigQuery.
- Acesse o Explorer, clique em + Adicionar e selecione Conexões com fontes de dados externas.
- Na lista Tipo de conexão, selecione Modelos remotos, funções remotas e BigLake (recurso do Cloud) da Vertex AI.
- No campo ID da conexão, digite
embedding_conn
.
- Clique em Criar conexão.
- Depois de criar a conexão, clique em Ir para a conexão no pop-up de confirmação para acessar a conexão e copiar o valor do ID da conta de serviço. Você vai precisar dele mais tarde para atribuir permissões à conta.
Conceder permissões do IAM
Para usar os dados do BigQuery e os recursos da Vertex AI, conceda as permissões do IAM necessárias à conta de serviço.
- Em seguida, você precisa conceder permissões pelo IAM. Siga as etapas a seguir:
- No console do Google Cloud, acesse o Menu de navegação (
) e selecione IAM e administrador > IAM.
- Clique em Conceder acesso.
- Na seção Adicionar principais:
- No campo de texto Novos principais, cole o valor ID da conta de serviço que você copiou anteriormente.
- Em Atribuir função, selecione as seguintes funções (procure-as se necessário):
- Proprietário de dados do BigQuery
- Usuário da Vertex AI
- Clique em Salvar para aplicar as alterações.
- Acesse APIs e serviços no Menu de navegação (
), clique em + Ativar APIs e serviços, pesquise API Vertex AI
e clique em Ativar.
Clique em Verificar meu progresso para conferir o objetivo.
Criar uma conexão de origem e conceder permissões do IAM.
Tarefa 2: gerar embeddings
-
No console do Google Cloud, no Menu de navegação (
), acesse o BigQuery.
-
No Explorer, acesse os três pontos ao lado do projeto e clique em Criar conjunto de dados. Em ID do conjunto de dados, insira CustomerReview
. Mantenha a outra opção padrão e clique em Criar conjunto de dados.
-
Para se conectar ao modelo de embedding, execute a seguinte consulta SQL no editor de consultas:
CREATE OR REPLACE MODEL `CustomerReview.Embeddings`
REMOTE WITH CONNECTION `us.embedding_conn`
OPTIONS (ENDPOINT = 'text-embedding-005');
- Para fazer upload do conjunto de dados de um arquivo CSV, execute a seguinte consulta SQL:
LOAD DATA OVERWRITE CustomerReview.customer_reviews
(
customer_review_id INT64,
customer_id INT64,
location_id INT64,
review_datetime DATETIME,
review_text STRING,
social_media_source STRING,
social_media_handle STRING
)
FROM FILES (
format = 'CSV',
uris = ['gs://spls/gsp1249/customer_reviews.csv']
);
-
(Opcional) Para conferir os dados enviados na tabela, clique em Ir para a tabela. Encontre o esquema da tabela e visualize os dados.
-
Para gerar embeddings com base no feedback recente dos clientes e armazená-los em uma tabela, execute a seguinte consulta SQL no editor de consultas:
CREATE OR REPLACE TABLE `CustomerReview.customer_reviews_embedded` AS
SELECT *
FROM ML.GENERATE_EMBEDDING(
MODEL `CustomerReview.Embeddings`,
(SELECT review_text AS content FROM `CustomerReview.customer_reviews`)
);
- (Opcional) Para analisar os resultados de embedding, clique em Ir para a tabela. Encontre o esquema da tabela e visualize os dados. Os resultados de embedding são números de ponto flutuante e podem não ser imediatamente interpretáveis.
Clique em Verificar meu progresso para conferir o objetivo.
Gerar embeddings.
Tarefa 3: pesquisar o espaço vetorial e recuperar itens semelhantes
- Para criar um índice do espaço de pesquisa vetorial, execute a seguinte consulta SQL:
Observação: para conjuntos de dados com menos de 5.000 linhas, como neste laboratório, não é necessário criar um índice. Esta etapa demonstra o código necessário para criar um índice de espaço vetorial quando necessário para conjuntos de dados maiores.
CREATE OR REPLACE VECTOR INDEX `CustomerReview.reviews_index`
ON `CustomerReview.customer_reviews_embedded`(ml_generate_embedding_result)
OPTIONS (distance_type = 'COSINE', index_type = 'IVF');
- Para pesquisar o espaço vetorial e recuperar os itens semelhantes, execute a seguinte consulta SQL:
CREATE OR REPLACE TABLE `CustomerReview.vector_search_result` AS
SELECT
query.query,
base.content
FROM
VECTOR_SEARCH(
TABLE `CustomerReview.customer_reviews_embedded`,
'ml_generate_embedding_result',
(
SELECT
ml_generate_embedding_result,
content AS query
FROM
ML.GENERATE_EMBEDDING(
MODEL `CustomerReview.Embeddings`,
(SELECT 'service' AS content)
)
),
top_k => 5,
options => '{"fraction_lists_to_search": 0.01}'
);
- (Opcional) Para conferir os resultados da consulta, clique em Ir para a tabela. Encontre o esquema da tabela e visualize os dados.
Clique em Verificar meu progresso para conferir o objetivo.
Pesquisar o espaço vetorial e recuperar itens semelhantes.
Tarefa 4: gerar uma resposta melhor
-
Para se conectar ao modelo do Gemini, execute a seguinte consulta SQL:
CREATE OR REPLACE MODEL `CustomerReview.Gemini`
REMOTE WITH CONNECTION `us.embedding_conn`
OPTIONS (ENDPOINT = 'gemini-pro');
-
Para melhorar as respostas do Gemini, forneça dados relevantes e recentes recuperados da pesquisa vetorial executando a seguinte consulta:
SELECT
ml_generate_text_llm_result AS generated
FROM
ML.GENERATE_TEXT(
MODEL `CustomerReview.Gemini`,
(
SELECT
CONCAT(
'Resuma o que os clientes pensam sobre nossos serviços',
STRING_AGG(FORMAT('review text: %s', base.content), ',\n')
) AS prompt
FROM
`CustomerReview.vector_search_result` AS base
),
STRUCT(
0.4 AS temperature,
300 AS max_output_tokens,
0.5 AS top_p,
5 AS top_k,
TRUE AS flatten_json_output
)
);
- Confira os resultados gerados pelo Gemini na seção Resultados da consulta abaixo do editor de consultas.
Perguntas para você:
1. Como você determina se o Gemini gera respostas melhores com a RAG do que sem ela? Teste com código.
2. Como melhorar o código? Por exemplo, em vez de salvar os resultados da pesquisa vetorial em uma tabela (Tarefa 3), esse processo pode ser incorporado diretamente à geração de respostas (Tarefa 4) para recuperação em tempo real?
Use o tempo restante do laboratório para responder a essas perguntas. Boa sorte!
Clique em Verificar meu progresso para conferir o objetivo.
Gerar a resposta melhorada com os dados recuperados da pesquisa vetorial.
Parabéns!
Para ajudar a Coffee-on-Wheels a receber insights com o feedback dos clientes sobre os serviços, você implementou um pipeline de RAG no BigQuery, dando ao Gemini informações relevantes e atualizadas. Você se conectou a modelos remotos de IA generativa, incluindo um modelo de embedding e o Gemini, e seguiu três etapas: criar embeddings, pesquisar um espaço vetorial e gerar uma resposta melhorada. O objetivo é permitir que você aplique a mesma abordagem para resolver seus próprios desafios de alucinação de IA.
Treinamento e certificação do Google Cloud
Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.
Manual atualizado em 22 de janeiro de 2025
Laboratório testado em 22 de janeiro de 2025
Copyright 2025 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.