GSP1202

Descripción general
La Búsqueda de vectores examina miles de millones de elementos similares o relacionados de manera semántica. Los servicios de coincidencia de similitud de vectores tienen muchos casos de uso, como la implementación de motores de recomendaciones, motores de búsqueda, chatbots y clasificación de texto. La coincidencia semántica puede simplificarse en pocos pasos. Primero, debes generar representaciones de embedding de muchos elementos (que se realizan fuera de la Búsqueda de vectores). En segundo lugar, debes subir tus embeddings a Google Cloud y, luego, vincular los datos a la Búsqueda de vectores. Después de agregar tus embeddings a la Búsqueda de vectores, puedes crear un índice para ejecutar consultas y obtener recomendaciones o resultados.
El uso de embeddings no se limita a palabras o texto. Puedes generar embeddings semánticas para muchos tipos de datos, incluidas imágenes, audio, video y preferencias del usuario. Para generar una embedding multimodal con Vertex AI, consulta Obtén embeddings multimodales. En este lab, aprenderás a usar embeddings de Vertex AI para texto con el fin de crear embeddings de texto y usarlas para crear un Índice de búsqueda de vectores.
Objetivos
En este lab, realizarás las siguientes tareas:
- Crear una instancia de notebook de Vertex AI
- Clonar y ejecutar el notebook del lab
- Crear embeddings de texto
- Crear y, luego, implementar el Índice de búsqueda de vectores
- Consulta el índice
Configuración y requisitos
Antes de hacer clic en el botón Comenzar lab
Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
- Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.
Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
- Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).
Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.
Cómo iniciar tu lab y acceder a la consola de Google Cloud
-
Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá un diálogo para que selecciones la forma de pago.
A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
- El botón para abrir la consola de Google Cloud
- El tiempo restante
- Las credenciales temporales que debes usar para el lab
- Otra información para completar el lab, si es necesaria
-
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordena las pestañas en ventanas separadas, una junto a la otra.
Nota: Si ves el diálogo Elegir una cuenta, haz clic en Usar otra cuenta.
-
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
{{{user_0.username | "Username"}}}
También puedes encontrar el nombre de usuario en el panel Detalles del lab.
-
Haz clic en Siguiente.
-
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
{{{user_0.password | "Password"}}}
También puedes encontrar la contraseña en el panel Detalles del lab.
-
Haz clic en Siguiente.
Importante: Debes usar las credenciales que te proporciona el lab. No uses las credenciales de tu cuenta de Google Cloud.
Nota: Usar tu propia cuenta de Google Cloud para este lab podría generar cargos adicionales.
-
Haz clic para avanzar por las páginas siguientes:
- Acepta los Términos y Condiciones.
- No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
- No te registres para obtener pruebas gratuitas.
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
Nota: Para acceder a los productos y servicios de Google Cloud, haz clic en el menú de navegación o escribe el nombre del servicio o producto en el campo Buscar.
Tarea 1: Crea una instancia de Vertex AI Workbench
-
En el menú de navegación de la consola de Google Cloud, haz clic en Vertex AI > Workbench.
-
Haz clic en Crear nueva.
-
En el cuadro de diálogo Crear instancia, usa el nombre predeterminado o ingresa un nombre único para la instancia de Vertex AI Workbench. Define la región en y la zona en , y deja el resto de la configuración como predeterminada.
-
Haz clic en Crear.
-
Haz clic en Abrir JupyterLab.
Clonar y ejecutar el notebook del lab
-
En tu notebook, haz clic en la terminal.
-
Ejecuta el siguiente comando para clonar el repo de IA generativa Google Cloud:
git clone https://github.com/GoogleCloudPlatform/generative-ai.git
Haz clic en Revisar mi progreso para verificar el objetivo.
Clonar y ejecutar el notebook del lab
-
En el panel de navegación izquierdo, navega a la carpeta generative-ai/embeddings
y abre el notebook intro-textemb-vectorsearch.ipynb
.
-
Para la instrucción Select Kernel, deja la opción predeterminada Python3 y haz clic en Select.
-
Desplázate hacia abajo hasta la sección Text Embeddings in Action y ejecuta las celdas de configuración.
-
Cuando configures tus variables de entorno, usa para la ubicación y para el ID del proyecto.
Nota: Puedes omitir las celdas del notebook que tienen la indicación Colab only.
- Puedes saltar la sección Set IAM permissions porque tu cuenta de servicio ya tiene los permisos necesarios.
Tarea 2: Genera embeddings
-
Navega a la sección Getting Started with Vertex AI Embeddings for Text y ejecuta las celdas para crear las embeddings de texto.
-
Navega a la sección Getting Started with Vector Search y ejecuta las celdas.
-
Guarda las embeddings en un archivo JSON.
-
Crea un nuevo bucket de Cloud Storage y copia el archivo en él.
Haz clic en Revisar mi progreso para verificar el objetivo.
Comenzar a usar la búsqueda de vectores
Tarea 3: Crea e implementa un índice
- Navega a la sección Create an Index y ejecuta las celdas para crear e implementar un índice.
Nota: Los índices tardan entre 20 y 30 minutos en crearse e implementarse. Mientras tanto, puedes consultar los siguientes recursos.
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear un índice
Explora la búsqueda de vectores y prueba la demostración
En esta tarea, explorarás el notebook de la búsqueda de vectores y probarás la demostración pública. Ya que la creación y la implementación del índice tarda alrededor de 30 minutos, puedes probar la demostración pública y explorar el notebook mientras esperas.
Mientras esperas: Prueba la demostración de búsqueda semántica de Stack Overflow
- La demostración de búsqueda semántica está disponible como demostración en directo pública. Selecciona “STACKOVERFLOW” y, luego, ingresa cualquier pregunta sobre programación como una consulta. De este modo, se ejecutará una búsqueda de texto en 8 millones de preguntas publicadas en Stack Overflow. Prueba la búsqueda semántica de texto con algunas consultas como “¿Cómo funcionan las filas de redistribución en SQL?” o preguntas arbitrarias sobre programación.
Mientras esperas: Explora el notebook de búsqueda de vectores
- En el notebook, navega a la sección Bringing Gen AI and LLMs to production services en la parte superior y lee los casos de uso y las explicaciones de la búsqueda de vectores.
Tarea 4: Ejecuta una consulta
- Navega a la sección Run Query y ejecuta las celdas para consultar en el índice. Puedes intentar cambiar la cadena en la variable
test_embeddings
para ver resultados diferentes.
Haz clic en Revisar mi progreso para verificar el objetivo.
Consultar el índice
¡Felicitaciones!
¡Felicitaciones! En este lab, aprendiste a crear embeddings de texto y a usarlas para crear un índice de búsqueda de vectores. Ahora puedes usar las embeddings de texto en tus propias aplicaciones.
Próximos pasos y más información
Consulta los siguientes recursos para obtener más información sobre las embeddings de texto y la búsqueda de vectores.
Capacitación y certificación de Google Cloud
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Última actualización del manual: 4 de abril de 2024
Prueba más reciente del lab: 4 de abril de 2024
Copyright 2025 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.