GSP1334
Descripción general
Imagina que deseas buscar en un catálogo de imágenes de productos almacenadas
en Cloud Storage para determinar si se vendió un producto similar en el
pasado. Para ello, puedes utilizar la búsqueda de vectores en BigQuery.
BigQuery es
una plataforma de datos completamente administrada y preparada para la IA que
admite la integración continua de fuentes de datos externas (como metadatos de
imágenes en un bucket de Cloud Storage) y conexiones a modelos remotos para la
búsqueda de vectores con el objetivo de mejorar tus flujos de trabajo de
análisis de datos con IA generativa.
La
búsqueda de vectores
es una metodología que se puede usar para encontrar rápidamente elementos
similares en función de su significado semántico (en lugar de la coincidencia
exacta de palabras clave) y se puede aplicar a muchos tipos de datos,
incluidos imágenes, videos y texto. La búsqueda de vectores usa embeddings,
que son vectores numéricos de alta dimensión que representan una entidad, como
texto o una imagen. Estos embeddings codifican la semántica de estas entidades
para facilitar su comparación. Esto tiene muchas aplicaciones, como mejorar la
capacidad para buscar ventas históricas de artículos similares en un conjunto
de datos de inventario o un catálogo de imágenes de productos.
Con el nombre o la descripción de un producto, puedes usar la búsqueda de
vectores en una tabla de objetos de BigQuery que contenga metadatos para las
imágenes del producto y, luego, identificar los productos más relacionados con
tus términos de búsqueda. Este flujo de trabajo integra la potencia de
Agent Platform
en BigQuery para la búsqueda de vectores, lo que te permite analizar datos
multimodales (incluidas imágenes y texto) en BigQuery para extraer
estadísticas prácticas y, así, mejorar las capacidades de toma de decisiones.
En este lab, obtendrás una introducción rápida sobre cómo funciona la búsqueda
de vectores multimodal en BigQuery. Comenzarás por otorgar algunos permisos y
crear una conexión a un modelo de embeddings en BigQuery. Luego, llamarás al
modelo para generar una tabla de embeddings que almacene representaciones
vectoriales de imágenes de productos en un bucket de Cloud Storage. Por
último, ejecutarás una búsqueda de vectores en las imágenes de productos
almacenadas en Cloud Storage para identificar los productos más similares a
tus términos de búsqueda según los atributos y los metadatos de las imágenes.
Actividades
En este lab, aprenderás a realizar las siguientes tareas:
-
Otorgar roles de Identity and Access Management (IAM) a la cuenta de
servicio de BigQuery
- Conectarse a un modelo de embeddings remoto en BigQuery
- Generar embeddings y guardarlos en una tabla de BigQuery
-
Ejecutar una búsqueda vectorial en las imágenes de productos en Cloud
Storage
Configuración y requisitos
Antes de hacer clic en el botón Comenzar lab
Lee estas instrucciones. Los labs cuentan con un temporizador que no se puede pausar. El temporizador, que comienza a funcionar cuando haces clic en Comenzar lab, indica por cuánto tiempo tendrás a tu disposición los recursos de Google Cloud.
Este lab práctico te permitirá realizar las actividades correspondientes en un entorno de nube real, no en uno de simulación o demostración. Para ello, se te proporcionan credenciales temporales nuevas que utilizarás para acceder a Google Cloud durante todo el lab.
Para completar este lab, necesitarás lo siguiente:
- Acceso a un navegador de Internet estándar. Se recomienda el navegador Chrome.
Nota: Usa una ventana del navegador privada o de incógnito (opción recomendada) para ejecutar el lab. Así evitarás conflictos entre tu cuenta personal y la cuenta de estudiante, lo que podría generar cargos adicionales en tu cuenta personal.
- Tiempo para completar el lab (recuerda que, una vez que comienzas un lab, no puedes pausarlo).
Nota: Usa solo la cuenta de estudiante para este lab. Si usas otra cuenta de Google Cloud, es posible que se apliquen cargos a esa cuenta.
Cómo iniciar tu lab y acceder a la consola de Google Cloud
-
Haz clic en el botón Comenzar lab. Si debes pagar por el lab, se abrirá un diálogo para que selecciones la forma de pago.
A la izquierda, se encuentra el panel Detalles del lab, que tiene estos elementos:
- El botón para abrir la consola de Google Cloud
- El tiempo restante
- Las credenciales temporales que debes usar para el lab
- Otra información para completar el lab, si es necesaria
-
Haz clic en Abrir la consola de Google Cloud (o haz clic con el botón derecho y selecciona Abrir el vínculo en una ventana de incógnito si ejecutas el navegador Chrome).
El lab inicia recursos y abre otra pestaña en la que se muestra la página de acceso.
Sugerencia: Ordena las pestañas en ventanas separadas, una junto a la otra.
Nota: Si ves el diálogo Elegir una cuenta, haz clic en Usar otra cuenta.
-
De ser necesario, copia el nombre de usuario a continuación y pégalo en el diálogo Acceder.
{{{user_0.username | "Username"}}}
También puedes encontrar el nombre de usuario en el panel Detalles del lab.
-
Haz clic en Siguiente.
-
Copia la contraseña que aparece a continuación y pégala en el diálogo Te damos la bienvenida.
{{{user_0.password | "Password"}}}
También puedes encontrar la contraseña en el panel Detalles del lab.
-
Haz clic en Siguiente.
Importante: Debes usar las credenciales que te proporciona el lab. No uses las credenciales de tu cuenta de Google Cloud.
Nota: Usar tu propia cuenta de Google Cloud para este lab podría generar cargos adicionales.
-
Haz clic para avanzar por las páginas siguientes:
- Acepta los Términos y Condiciones.
- No agregues opciones de recuperación o autenticación de dos factores (esta es una cuenta temporal).
- No te registres para obtener pruebas gratuitas.
Después de un momento, se abrirá la consola de Google Cloud en esta pestaña.
Nota: Para acceder a los productos y servicios de Google Cloud, haz clic en el menú de navegación o escribe el nombre del servicio o producto en el campo Buscar.
Tarea 1: Otorga roles de IAM a la cuenta de servicio de BigQuery
En este entorno de lab, se crearon previamente varios recursos, incluida una
conexión externa de BigQuery
llamada remote-models-connection y una
tabla de objetos de BigQuery
llamada image_object_table. Estos recursos te permiten
acceder a datos no estructurados en Cloud Storage, como imágenes, y
consultarlos. Cuando se creó la conexión externa, también se generó
automáticamente una cuenta de servicio de BigQuery, que se puede usar para
controlar el acceso a los recursos.
En esta tarea, otorgarás roles de IAM específicos a la cuenta de servicio de
BigQuery generada automáticamente para acceder a los archivos de imagen en
Cloud Storage y a los recursos de Agent Platform necesarios para la búsqueda
de vectores.
Cómo abrir la consola de BigQuery
- En la consola de Google Cloud, selecciona el menú de navegación > BigQuery.
Se abrirá el cuadro de mensaje Te damos la bienvenida a BigQuery en la consola de Cloud. Este cuadro de mensaje contiene un vínculo a la guía de inicio rápido y las notas de la versión.
- Haz clic en Listo.
Se abrirá la consola de BigQuery.
Identifica la cuenta de servicio de BigQuery generada automáticamente
-
Expande la flecha junto al ID del proyecto () y, luego, expande la flecha que se encuentra junto a
Conexiones.
-
Haz clic en la conexión llamada
.remote-models-connection.
-
En la página Información de conexión, copia el
ID de la cuenta de servicio para usarlo en el siguiente
paso.
Por ejemplo:
bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com
Otorga roles de IAM a la cuenta de servicio de BigQuery
-
En el menú de navegación (
) de la consola de Google Cloud, selecciona
IAM y administración > IAM.
-
Haz clic en Otorgar acceso.
-
En Entidades nuevas, ingresa el ID de la cuenta de
servicio que copiaste en la sección anterior (por ejemplo,
bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com).
-
En Selecciona un rol, filtra por
Usuario de Agent Platform y selecciónalo en los
resultados.
-
Haz clic en Agregar otro rol.
-
En Selecciona un rol, filtra por
Visualizador de objetos de Storage y selecciónalo en los
resultados.
-
Haz clic en Guardar.
Haz clic en Revisar mi progreso para verificar el objetivo.
Otorgar roles de IAM a la cuenta de servicio de BigQuery
Tarea 2: Crea un modelo remoto de BigQuery
Ahora que otorgaste los roles necesarios a la cuenta de servicio de BigQuery,
puedes crear un
modelo remoto en BigQuery
para acceder a las funcionalidades de Agent Platform, como las funciones
potenciadas por IA generativa.
En esta tarea, usarás la conexión externa de BigQuery llamada
remote-models-connection para crear un modelo remoto llamado
embeddings_model que se conecte a un modelo de embeddings
disponible en Agent Platform. Dado que los datos de imagen se almacenan en un
bucket de Cloud Storage en un formato no estructurado, debes designar un
modelo multimodal como el extremo para controlar este tipo de datos de manera
eficaz.
-
En el menú de navegación (
) de la consola de Google Cloud, selecciona BigQuery >
Studio.
-
En la ventana de consulta en SQL, pega la siguiente consulta en SQL para
crear el modelo remoto de BigQuery en el conjunto de datos existente de
BigQuery llamado products y haz clic en
Ejecutar:
CREATE OR REPLACE MODEL
`{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`
REMOTE WITH CONNECTION `{{{project_0.project_id | filled in at lab start}}}.{{{project_0.startup_script.bq_gcp_region | "BigQuery location"}}}.remote-models-connection`
OPTIONS(
ENDPOINT = '{{{project_0.startup_script.multi_modal_embedding_id | Multimodal embeddings model}}}'
);
Nota: Si se muestra un error relacionado con los permisos de la cuenta de servicio (que asignaste en la tarea anterior), espera unos minutos y, luego, vuelve a ejecutar la consulta.
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear un modelo remoto de BigQuery
Tarea 3: Crea una tabla de embeddings para las imágenes que se enumeran en una
tabla de objetos
Después de crear un modelo remoto en BigQuery, el siguiente paso es llamar al
modelo para generar los embeddings basados en los archivos de imagen
almacenados en Cloud Storage. Como se mencionó en la tarea 1, se creó
previamente una
tabla de objetos
llamada image_object_table para este entorno de lab, que se
puede usar para consultar los archivos de imagen.
En esta tarea, llamarás al modelo de embeddings para que se ejecute en
product_image_object_table y almacenarás los resultados en
una nueva tabla llamada product_embeddings. Cuando se ejecuta
la consulta, BigQuery envía los datos de la tabla de objetos al
modelo de embeddings multimodales, que devuelve los embeddings que se pueden usar en las búsquedas de vectores
para encontrar entidades semánticamente similares.
-
En la ventana de consulta en SQL, ejecuta la siguiente consulta para crear
la tabla de embeddings:
CREATE OR REPLACE TABLE `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`
AS SELECT *, REGEXP_EXTRACT(uri, r'[^/]+$') as product_name
FROM ML.GENERATE_EMBEDDING
(
MODEL `{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`,
TABLE `{{{project_0.project_id | filled in at lab start}}}.products.image_object_table`
);
-
En la ventana de consulta en SQL, ejecuta la siguiente consulta para revisar
los datos en la nueva tabla de embeddings:
SELECT * FROM `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`;
Haz clic en Revisar mi progreso para verificar el objetivo.
Crear una tabla de embeddings para las imágenes que se enumeran en una tabla
de objetos
Tarea 4: Ejecuta una búsqueda de vectores en imágenes de productos en Cloud
Storage
Como se menciona en la descripción general de este lab, la
búsqueda de vectores
en BigQuery te permite usar embeddings calculados (que son vectores numéricos)
para encontrar objetos semánticamente similares. En particular, la búsqueda de
vectores usa métricas de distancia que representan la distancia entre los
vectores en un espacio de embeddings para compararlos y clasificarlos según su
similitud. En BigQuery, la función de búsqueda de vectores admite tres
tipos de distancia, incluidos el euclidiano (que es el predeterminado), el coseno y el producto
escalar.
En esta tarea, usarás la similitud de coseno (que es el coseno del ángulo
entre dos vectores) para identificar las 3 imágenes de productos más similares
en Google Cloud Storage para una frase de búsqueda específica:
colorful sweaters for women.
-
En la ventana de consultas en SQL, ejecuta la siguiente consulta que usa la
función
VECTOR_SEARCH para buscar en la tabla de embeddings de
productos y encontrar las imágenes más similares al término de búsqueda
proporcionado:
SELECT base.uri,
base.product_name,
base.content_type,
distance
FROM
VECTOR_SEARCH(TABLE products.product_embeddings,'ml_generate_embedding_result',
(
SELECT ml_generate_embedding_result AS embedding_col
FROM
ML.GENERATE_EMBEDDING
(
MODEL `products.embeddings_model`,
(SELECT 'colorful sweaters for women' AS content),
STRUCT(TRUE AS flatten_json_output)
)
),
TOP_K => 3,
DISTANCE_TYPE => 'COSINE'
);
Revisa las imágenes que mejor coinciden en Cloud Storage
[Opcional] Para ver las imágenes específicas que se devolvieron como las
coincidencias más altas, puedes ir al bucket de Cloud Storage y abrir cada
imagen.
-
En el menú de navegación (
) de la consola de Google Cloud, selecciona
Cloud Storage > Buckets.
-
Haz clic en el bucket llamado
y, luego, en el nombre de una imagen (por ejemplo,
Onesie.jpg).
-
Haz clic en la URL autenticada para ver la imagen (por
ejemplo,
https://storage.cloud.google.com/qwiklabs-gcp-04-dc2812426125/Onesie.jpg).
Haz clic en Revisar mi progreso para verificar el objetivo.
Ejecutar una búsqueda de vectores en imágenes de productos en Cloud Storage
¡Felicitaciones!
En este lab, accediste a una introducción rápida a la búsqueda de vectores en
BigQuery y aplicaste estos conocimientos para encontrar en Cloud Storage las
imágenes más relevantes con un término de búsqueda deseado.
Próximos pasos y más información
Capacitación y certificación de Google Cloud
Recibe la formación que necesitas para aprovechar al máximo las tecnologías de Google Cloud. Nuestras clases incluyen habilidades técnicas y recomendaciones para ayudarte a avanzar rápidamente y a seguir aprendiendo. Para que puedas realizar nuestros cursos cuando más te convenga, ofrecemos distintos tipos de capacitación de nivel básico a avanzado: a pedido, presenciales y virtuales. Las certificaciones te ayudan a validar y demostrar tus habilidades y tu conocimiento técnico respecto a las tecnologías de Google Cloud.
Última actualización del manual: 16 de marzo de 2026
Prueba más reciente del lab: 16 de marzo de 2026
Copyright 2026 Google LLC. All rights reserved. Google y el logotipo de Google son marcas de Google LLC. Los demás nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que estén asociados.