GSP1202

Visão geral
O Vector Search pode pesquisar em bilhões de itens semanticamente parecidos ou relacionados semanticamente. Um serviço de correspondência por similaridade vetorial tem muitos casos de uso, como a implementação de mecanismos de recomendação, mecanismos de pesquisa, chatbots e classificação de texto. A correspondência semântica pode ser simplificada em algumas etapas. Primeiro, você precisa gerar representações de embedding de muitos itens (feito fora do Vector Search). Em seguida, você faz o upload dos seus embeddings para o Google Cloud e vincula os dados ao Vector Search. Depois que seus embeddings forem adicionados ao Vector Search, você poderá criar um índice para executar consultas e receber recomendações ou resultados.
O uso de embeddings não se limita a palavras ou texto. É possível gerar embeddings semânticos para vários tipos de dados, incluindo imagens, áudio, vídeo e preferências do usuário. Para gerar um embedding multimodal com a Vertex AI, consulte Usar embeddings multimodais. Neste laboratório, você vai aprender a usar o Embeddings da Vertex AI para texto para criar embeddings de texto e usá-los na criação de um índice de pesquisa vetorial.
Objetivos
Neste laboratório, você realizará as seguintes tarefas:
- Criar uma instância de notebooks da Vertex AI
- Clonar e executar o notebook do laboratório
- Criar embeddings de texto
- Criar e implantar o índice de pesquisa de vetores
- Consultar o índice
Configuração e requisitos
Antes de clicar no botão Começar o Laboratório
Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é ativado quando você clica em Iniciar laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.
Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, e não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.
Confira os requisitos para concluir o laboratório:
- Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima (recomendado) ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e de estudante, o que poderia causar cobranças extras na sua conta pessoal.
- Tempo para concluir o laboratório: não se esqueça que, depois de começar, não será possível pausar o laboratório.
Observação: use apenas a conta de estudante neste laboratório. Se usar outra conta do Google Cloud, você poderá receber cobranças nela.
Como iniciar seu laboratório e fazer login no console do Google Cloud
-
Clique no botão Começar o laboratório. Se for preciso pagar por ele, uma caixa de diálogo vai aparecer para você selecionar a forma de pagamento.
No painel Detalhes do Laboratório, à esquerda, você vai encontrar o seguinte:
- O botão Abrir Console do Google Cloud
- O tempo restante
- As credenciais temporárias que você vai usar neste laboratório
- Outras informações, se forem necessárias
-
Se você estiver usando o navegador Chrome, clique em Abrir console do Google Cloud ou clique com o botão direito do mouse e selecione Abrir link em uma janela anônima.
O laboratório ativa os recursos e depois abre a página Fazer Login em outra guia.
Dica: coloque as guias em janelas separadas lado a lado.
Observação: se aparecer a caixa de diálogo Escolher uma conta, clique em Usar outra conta.
-
Se necessário, copie o Nome de usuário abaixo e cole na caixa de diálogo Fazer login.
{{{user_0.username | "Username"}}}
Você também encontra o nome de usuário no painel Detalhes do Laboratório.
-
Clique em Próxima.
-
Copie a Senha abaixo e cole na caixa de diálogo de Olá.
{{{user_0.password | "Password"}}}
Você também encontra a senha no painel Detalhes do Laboratório.
-
Clique em Próxima.
Importante: você precisa usar as credenciais fornecidas no laboratório, e não as da sua conta do Google Cloud.
Observação: se você usar sua própria conta do Google Cloud neste laboratório, é possível que receba cobranças adicionais.
-
Acesse as próximas páginas:
- Aceite os Termos e Condições.
- Não adicione opções de recuperação nem autenticação de dois fatores (porque essa é uma conta temporária).
- Não se inscreva em testes gratuitos.
Depois de alguns instantes, o console do Google Cloud será aberto nesta guia.
Observação: para acessar os produtos e serviços do Google Cloud, clique no Menu de navegação ou digite o nome do serviço ou produto no campo Pesquisar.
Tarefa 1: criar uma instância do Vertex AI Workbench
-
No menu de navegação do console do Google Cloud, clique em Vertex AI > Workbench.
-
Clique em + Criar nova.
-
Na caixa de diálogo Criar instância, use o nome padrão ou insira um exclusivo para a instância do Vertex AI Workbench. Defina a região como e a zona como . Mantenha a opção padrão no resto das configurações.
-
Clique em Criar.
-
Clique em Abrir o JupyterLab.
Clonar e executar o notebook do laboratório
-
No seu notebook, clique em Terminal.
-
Execute o seguinte comando para clonar o repositório da IA generativa do Google Cloud:
git clone https://github.com/GoogleCloudPlatform/generative-ai.git
Clique em Verificar meu progresso para conferir o objetivo.
Clonar e executar o notebook do laboratório
-
No painel de navegação à esquerda, navegue até a pasta generative-ai/embeddings
e abra o notebook intro-textemb-vectorsearch.ipynb
.
-
No comando Selecionar Kernel, deixe o Python3 como padrão e clique em Selecionar.
-
Role para baixo até a seção Embeddings de texto em ação e execute as células de configuração.
-
Ao definir suas variáveis de ambiente, use para o local e para o ID do projeto.
Observação: é possível pular as células do notebook que tenham a indicação Colab only.
-
Pule a seção Definir permissões do IAM porque sua conta de serviço já tem as permissões necessárias.
Tarefa 2: gerar embeddings
-
Navegue até a seção Introdução ao Embeddings da Vertex AI para texto e execute as células para criar os embeddings de texto.
-
Navegue até a seção Introdução ao Vector Search e execute as células.
-
Salve os embeddings em um arquivo JSON.
-
Crie um novo bucket do Cloud Storage e copie o arquivo para ele.
Clique em Verificar meu progresso para conferir o objetivo.
Introdução ao Vector Search
Tarefa 3: criar e implantar um índice
- Navegue até a seção Criar um índice e execute as células para criar e implantar um índice.
Observação: os processos de criar e implantar índice levam de 20 a 30 minutos. Fique à vontade para conferir os seguintes recursos enquanto espera.
Clique em Verificar meu progresso para conferir o objetivo.
Criar um índice
Analisar o Vector Search e testar a demonstração
Nesta tarefa, você vai analisar o notebook do Vector Search e testar a demonstração pública. Como a criação e a implantação de índices levam cerca de 30 minutos, você pode experimentar a demonstração pública e analisar o notebook enquanto espera.
Enquanto você espera: experimente a demonstração de pesquisa semântica do Stack Overflow
- A demonstração pública do Vector Search está disponível como uma demonstração pública ao vivo. Selecione "STACKOVERFLOW" e insira uma pergunta de programação como uma consulta, para que ele execute uma pesquisa de texto em 8 milhões de perguntas publicadas no Stack Overflow. Experimente a pesquisa semântica de texto com algumas consultas como "Como embaralhar linhas no SQL?" ou perguntas arbitrárias sobre programação.
Enquanto você espera: Introdução ao notebook do Vector Search
- No notebook, navegue até a seção Trazendo a IA generativa e os LLMs para os serviços de produção na parte superior e leia os casos de uso e as explicações da pesquisa de vetores.
Tarefa 4: executar uma consulta
- Navegue até a seção Executar consulta e execute as células para consultar o índice. Você pode tentar alterar a string na variável
test_embeddings
para ver resultados diferentes.
Clique em Verificar meu progresso para conferir o objetivo.
Consultar o índice
Parabéns!
Parabéns! Neste laboratório, você aprendeu a criar embeddings de texto e usá-los para criar um índice de pesquisa vetorial. Agora você pode começar a usar embeddings de texto nos seus próprios aplicativos.
Próximas etapas/saiba mais
Confira os recursos a seguir para saber mais sobre embeddings de texto e pesquisa vetorial:
Treinamento e certificação do Google Cloud
Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.
Manual atualizado em 4 de abril de 2024
Laboratório testado em 4 de abril de 2024
Copyright 2025 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.