GSP1334
Ringkasan
Bayangkan Anda ingin menelusuri katalog gambar produk yang disimpan di Cloud
Storage untuk menentukan apakah produk serupa pernah dijual sebelumnya. Anda
dapat melakukannya dengan memanfaatkan penelusuran vektor di BigQuery.
BigQuery
adalah platform data yang terkelola sepenuhnya dan berteknologi AI yang
mendukung integrasi lancar sumber data eksternal (seperti metadata dari gambar
di bucket Cloud Storage) dan koneksi ke model jarak jauh untuk penelusuran
vektor guna meningkatkan alur kerja analisis data Anda dengan AI generatif.
Penelusuran vektor
adalah metodologi yang dapat digunakan untuk menemukan item serupa dengan
cepat berdasarkan makna semantiknya (bukan pencocokan kata kunci yang sama
persis) dan dapat diterapkan ke banyak jenis data termasuk gambar, video, dan
teks. Penelusuran vektor menggunakan embedding yang merupakan vektor numerik
berdimensi tinggi yang merepresentasikan entity, seperti teks atau gambar.
Embedding ini mengenkode semantik tentang entity tersebut untuk mempermudah
perbandingan. Metodologi ini memiliki banyak aplikasi seperti kemampuan yang
ditingkatkan untuk menelusuri histori penjualan item serupa dalam set data
inventaris atau katalog gambar produk.
Dengan nama atau deskripsi produk, Anda dapat menggunakan penelusuran vektor
pada tabel objek BigQuery yang berisi metadata untuk gambar produk dan
mengidentifikasi produk yang paling terkait erat dengan istilah penelusuran
Anda. Alur kerja ini mengintegrasikan kecanggihan
Agent Platform
ke dalam BigQuery untuk penelusuran vektor, yang memungkinkan Anda
menganalisis data multimodal (termasuk gambar dan teks) di BigQuery untuk
mengekstrak hasil analisis yang bisa ditindaklanjuti, sehingga meningkatkan
kemampuan pengambilan keputusan.
Di lab ini, Anda akan mengenal cara kerja penelusuran vektor multimodal di
BigQuery. Anda mulai dengan memberikan beberapa izin dan membuat koneksi ke
model embedding di BigQuery. Kemudian, Anda memanggil model itu untuk membuat
tabel embedding guna menyimpan representasi vektor gambar produk di bucket
Cloud Storage. Terakhir, Anda menjalankan penelusuran vektor pada gambar
produk yang disimpan di Cloud Storage untuk mengidentifikasi produk yang
paling mirip dengan istilah penelusuran Anda berdasarkan fitur dan metadata
gambar.
Yang akan Anda lakukan
Di lab ini, Anda akan mempelajari cara melakukan tugas-tugas berikut:
-
Memberikan peran Identity and Access Management (IAM) ke akun layanan
BigQuery.
- Membuat koneksi ke model embedding jarak jauh di BigQuery.
- Membuat embedding dan menyimpannya ke tabel di BigQuery.
- Menjalankan penelusuran vektor pada gambar produk di Cloud Storage.
Penyiapan dan persyaratan
Sebelum mengklik tombol Start Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
Catatan: Gunakan jendela Samaran (direkomendasikan) atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Catatan: Hanya gunakan akun siswa untuk lab ini. Jika Anda menggunakan akun Google Cloud yang berbeda, Anda mungkin akan dikenai tagihan ke akun tersebut.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran.
Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
-
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}}
Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}}
Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda.
Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
-
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Catatan: Untuk mengakses produk dan layanan Google Cloud, klik Navigation menu atau ketik nama layanan atau produk di kolom Search.
Tugas 1. Memberikan peran IAM ke akun layanan BigQuery
Di lingkungan lab ini, beberapa resource telah dibuat sebelumnya, termasuk
koneksi eksternal BigQuery
bernama remote-models-connection dan
tabel objek BigQuery
bernama image_object_table. Dengan resource ini, Anda dapat
mengakses dan mengkueri data tidak terstruktur di Cloud Storage seperti
gambar. Setelah koneksi eksternal dibuat, akun layanan BigQuery juga dibuat
secara otomatis, yang dapat digunakan untuk mengontrol akses ke resource.
Dalam tugas ini, Anda akan memberikan peran IAM tertentu ke akun layanan
BigQuery yang dibuat otomatis untuk mengakses file gambar di Cloud Storage dan
resource Agent Platform yang diperlukan untuk penelusuran vektor.
Membuka konsol BigQuery
- Di Konsol Google Cloud, pilih Navigation menu > BigQuery.
Kotak pesan Welcome to BigQuery in the Cloud Console akan terbuka. Kotak pesan ini menyediakan link ke panduan memulai dan catatan rilis.
- Klik Done.
Konsol BigQuery terbuka.
Mengidentifikasi akun layanan BigQuery yang dibuat secara otomatis
-
Perluas panah di samping project ID (), lalu perluas panah di samping Connections.
-
Klik koneksi bernama
.remote-models-connection.
-
Di halaman Connection info, salin
Service account ID untuk digunakan pada langkah
berikutnya.
Misalnya:
bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com
Memberikan peran IAM ke akun layanan BigQuery
-
Di Konsol Google Cloud, pada Navigation menu (
), pilih IAM & Admin > IAM.
-
Klik Grant access.
-
Untuk New principals, masukkan ID akun layanan yang Anda
salin di bagian sebelumnya (seperti
bqcx-1054723899402-whbp@gcp-sa-bigquery-condel.iam.gserviceaccount.com).
-
Untuk Select a role, filter
Agent Platform User, lalu pilih dari hasilnya.
-
Klik Add another role.
-
Untuk Select a role, filter
Storage Object Viewer, lalu pilih dari hasilnya.
-
Klik Save.
Klik Periksa progres saya untuk memverifikasi tujuan.
Memberikan peran IAM ke akun layanan BigQuery
Tugas 2. Membuat model jarak jauh BigQuery
Setelah memberikan peran yang diperlukan ke akun layanan BigQuery, Anda dapat
membuat
model jarak jauh di BigQuery
untuk mengakses fungsi Agent Platform seperti fitur AI generatif.
Dalam tugas ini, Anda menggunakan koneksi eksternal BigQuery bernama
remote-models-connection untuk membuat model jarak jauh
bernama embeddings_model yang terhubung ke model embedding
yang tersedia di Agent Platform. Karena data gambar Anda disimpan di bucket
Cloud Storage dalam format tidak terstruktur, sebaiknya Anda menetapkan model
multimodal sebagai endpoint untuk menangani jenis data ini secara efektif.
-
Di Konsol Google Cloud, pada Navigation menu (
), pilih BigQuery > Studio.
-
Di jendela SQL query, tempel kueri SQL berikut untuk membuat model jarak
jauh BigQuery di set data BigQuery yang ada bernama
products, lalu klik Run:
CREATE OR REPLACE MODEL
`{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`
REMOTE WITH CONNECTION `{{{project_0.project_id | filled in at lab start}}}.{{{project_0.startup_script.bq_gcp_region | "BigQuery location"}}}.remote-models-connection`
OPTIONS(
ENDPOINT = '{{{project_0.startup_script.multi_modal_embedding_id | Multimodal embeddings model}}}'
);
Catatan: Jika Anda menerima error terkait izin akun layanan (yang Anda tetapkan pada tugas sebelumnya), tunggu beberapa menit, lalu jalankan kueri lagi.
Klik Periksa progres saya untuk memverifikasi tujuan.
Membuat model jarak jauh BigQuery
Tugas 3. Membuat tabel embedding untuk gambar yang tercantum dalam tabel objek
Setelah membuat model jarak jauh di BigQuery, langkah berikutnya adalah
memanggil model untuk membuat embedding berdasarkan file gambar yang disimpan
di Cloud Storage. Seperti yang disebutkan dalam Tugas 1,
tabel objek
bernama image_object_table telah dibuat sebelumnya untuk
lingkungan lab ini dan dapat digunakan untuk mengkueri file gambar.
Dalam tugas ini, Anda memanggil model embedding untuk dijalankan di
product_image_object_table dan menyimpan hasilnya dalam tabel
baru bernama product_embeddings. Saat menjalankan kueri,
BigQuery mengirimkan data dalam tabel objek ke
model embedding multimodal, yang menampilkan embedding yang dapat digunakan untuk penelusuran vektor
guna menemukan entity yang secara semantik mirip.
-
Di jendela SQL query, jalankan kueri SQL berikut untuk membuat tabel
embedding:
CREATE OR REPLACE TABLE `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`
AS SELECT *, REGEXP_EXTRACT(uri, r'[^/]+$') as product_name
FROM ML.GENERATE_EMBEDDING
(
MODEL `{{{project_0.project_id | filled in at lab start}}}.products.embeddings_model`,
TABLE `{{{project_0.project_id | filled in at lab start}}}.products.image_object_table`
);
-
Di jendela SQL query, jalankan kueri berikut untuk meninjau data dalam tabel
embedding baru:
SELECT * FROM `{{{project_0.project_id | filled in at lab start}}}.products.product_embeddings`;
Klik Periksa progres saya untuk memverifikasi tujuan.
Membuat tabel embedding untuk gambar yang tercantum dalam tabel objek
Tugas 4. Menjalankan penelusuran vektor pada gambar produk di Cloud Storage
Seperti yang disampaikan dalam ringkasan lab ini,
penelusuran vektor
di BigQuery memungkinkan Anda menggunakan embedding yang dihitung (yaitu
vektor numerik) untuk menemukan objek yang memiliki kesamaan semantik. Secara
khusus, penelusuran vektor menggunakan metrik jarak yang merepresentasikan
jarak antara vektor dalam ruang embedding untuk membandingkan dan memberinya
peringkat berdasarkan kemiripan. Di BigQuery, fungsi penelusuran vektor
mendukung tiga
jenis jarak, termasuk Euclidean (jenis default), kosinus, dan perkalian titik.
Dalam tugas ini, Anda menggunakan kesamaan kosinus (yaitu kosinus sudut antara
dua vektor) untuk mengidentifikasi 3 gambar produk yang paling mirip di Google
Cloud Storage dengan frasa penelusuran tertentu:
colorful sweaters for women.
-
Di jendela SQL query, jalankan kueri berikut yang menggunakan fungsi
VECTOR_SEARCH untuk menelusuri tabel embedding produk dan
menemukan gambar yang paling mirip dengan istilah penelusuran yang
diberikan:
SELECT base.uri,
base.product_name,
base.content_type,
distance
FROM
VECTOR_SEARCH(TABLE products.product_embeddings,'ml_generate_embedding_result',
(
SELECT ml_generate_embedding_result AS embedding_col
FROM
ML.GENERATE_EMBEDDING
(
MODEL `products.embeddings_model`,
(SELECT 'colorful sweaters for women' AS content),
STRUCT(TRUE AS flatten_json_output)
)
),
TOP_K => 3,
DISTANCE_TYPE => 'COSINE'
);
Meninjau gambar yang paling cocok di Cloud Storage
[Opsional] Untuk melihat gambar tertentu yang telah ditampilkan sebagai
kecocokan tertinggi, Anda dapat membuka bucket Cloud Storage, lalu membuka
setiap gambar.
-
Di Konsol Google Cloud, dari Navigation menu (
), pilih Cloud Storage > Buckets.
-
Klik bucket bernama
, lalu klik nama gambar (seperti Onesie.jpg).
-
Klik Authenticated URL untuk melihat gambar (seperti
https://storage.cloud.google.com/qwiklabs-gcp-04-dc2812426125/Onesie.jpg).
Klik Periksa progres saya untuk memverifikasi tujuan.
Menjalankan penelusuran vektor pada gambar produk di Cloud Storage
Selamat!
Di lab ini, Anda telah mengenal penelusuran vektor di BigQuery dan
menggunakannya untuk menemukan gambar di Cloud Storage yang paling relevan
dengan istilah penelusuran yang diinginkan.
Langkah berikutnya/Pelajari lebih lanjut
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 16 Maret 2026
Lab Terakhir Diuji pada 16 Maret 2026
Hak cipta 2026 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.