GSP1202

Ringkasan
Penelusuran Vektor dapat melakukan penelusuran di antara miliaran item yang memiliki kemiripan atau keterkaitan secara semantik. Layanan pencocokan kemiripan vektor memiliki banyak kasus penggunaan, seperti menerapkan mesin pemberi saran, mesin telusur, chatbot, dan klasifikasi teks. Pencocokan semantik dapat disederhanakan menjadi beberapa langkah. Pertama, Anda harus membuat representasi embedding dari banyak item (dilakukan di luar Penelusuran Vektor). Kedua, upload embedding Anda ke Google Cloud, lalu tautkan data Anda ke Penelusuran Vektor. Setelah embedding ditambahkan ke Penelusuran Vektor, Anda dapat membuat indeks untuk menjalankan kueri guna mendapatkan rekomendasi atau hasil.
Penggunaan embedding tidak terbatas pada kata atau teks. Anda dapat membuat embedding semantik untuk berbagai jenis data, termasuk gambar, audio, video, dan preferensi pengguna. Untuk membuat embedding multimodal dengan Vertex AI, baca artikel Mendapatkan embedding multimodal. Di lab ini, Anda akan belajar cara menggunakan Vertex AI Embeddings untuk teks guna membuat embedding teks dan menggunakannya untuk membuat indeks penelusuran vektor.
Tujuan
Di lab ini, Anda akan melakukan tugas berikut:
- Membuat Instance Notebook Vertex AI
- Membuat clone dan menjalankan notebook lab
- Membuat embedding teks
- Membuat dan men-deploy indeks penelusuran vektor
- Membuat kueri indeks
Penyiapan dan persyaratan
Sebelum mengklik tombol Start Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
Catatan: Gunakan jendela Samaran (direkomendasikan) atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Catatan: Hanya gunakan akun siswa untuk lab ini. Jika Anda menggunakan akun Google Cloud yang berbeda, Anda mungkin akan dikenai tagihan ke akun tersebut.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran.
Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
-
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}}
Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}}
Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda.
Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
-
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Catatan: Untuk mengakses produk dan layanan Google Cloud, klik Navigation menu atau ketik nama layanan atau produk di kolom Search.
Tugas 1. Membuat Instance Vertex AI Workbench
-
Di Konsol Google Cloud, pada Navigation menu, klik Vertex AI > Workbench.
-
Klik + Create New.
-
Dalam dialog Create instance, gunakan nama default atau masukkan nama unik untuk Instance Vertex AI Workbench. Tetapkan region ke dan zona ke dan biarkan setelan lainnya tetap default.
-
Klik Create.
-
Klik Open JupyterLab.
Membuat clone dan menjalankan notebook lab
-
Pada notebook, klik Terminal.
-
Jalankan perintah berikut untuk membuat clone repo AI Generatif Google Cloud:
git clone https://github.com/GoogleCloudPlatform/generative-ai.git
Klik Check my progress untuk memverifikasi tujuan.
Membuat clone dan menjalankan notebook lab
-
Di panel navigasi kiri, buka folder generative-ai/embeddings
dan buka notebook intro-textemb-vectorsearch.ipynb
.
-
Untuk prompt Select Kernel, biarkan pilihan default Python3, lalu klik Select.
-
Scroll ke bawah hingga bagian Text Embeddings in Action, lalu jalankan sel penyiapan.
-
Saat menyetel variabel lingkungan Anda, gunakan untuk lokasi, dan untuk Project ID.
Catatan: Anda dapat melewatkan sel notebook yang bertanda Colab only.
- Pilih Skip pada bagian Set IAM permissions, karena akun layanan Anda sudah memiliki izin yang diperlukan.
Tugas 2. Membuat embedding
-
Buka bagian Getting Started with Vertex AI Embeddings for Text dan jalankan sel-selnya untuk membuat embedding teks.
-
Buka bagian Getting Started with Vector Search dan jalankan sel-selnya.
-
Simpan embedding dalam file JSON.
-
Buat bucket Cloud Storage baru dan salin file ke dalamnya.
Klik Check my progress untuk memverifikasi tujuan.
Memulai Penggunaan Penelusuran Vektor
Tugas 3. Membuat dan men-deploy indeks
- Buka bagian Create an Index dan jalankan sel-selnya untuk membuat dan men-deploy indeks.
Catatan: pembuatan dan deployment indeks membutuhkan waktu sekitar 20-30 menit. Jangan ragu untuk memeriksa referensi berikut sambil menunggu.
Klik Check my progress untuk memverifikasi tujuan.
Membuat Indeks
Menjelajahi Penelusuran Vektor dan mencoba demonya
Dalam tugas ini, Anda akan menjelajahi notebook Penelusuran Vektor dan mencoba demo publik. Karena pembuatan dan deployment indeks memerlukan waktu sekitar 30 menit, Anda dapat mencoba demo publik dan menjelajahi notebook sambil menunggu.
Sementara Anda menunggu: Coba demo penelusuran semantik Stack Overflow
- Demo publik Penelusuran Vektor tersedia sebagai demo live publik. Pilih "STACKOVERFLOW" dan masukkan pertanyaan coding apa pun sebagai kueri, agar ia menjalankan penelusuran teks pada 8 juta pertanyaan yang diposting di Stack Overflow. Coba penelusuran semantik teks dengan pertanyaan seperti 'Bagaimana cara mengacak baris dalam SQL?' atau pertanyaan pemrograman apa saja.
Sementara Anda menunggu: Jelajahi notebook Penelusuran Vektor
- Pada notebook, buka bagian Bringing Gen AI and LLMs to production services di bagian atas dan baca kasus penggunaan penelusuran vektor serta penjelasannya.
Tugas 4. Menjalankan kueri
- Buka bagian Run Query dan jalankan sel-selnya untuk mengkueri indeks. Anda dapat mencoba mengubah string di variabel
test_embeddings
untuk melihat hasil yang berbeda.
Klik Check my progress untuk memverifikasi tujuan.
Mengkueri Indeks
Selamat!
Selamat! Di lab ini, Anda telah belajar cara membuat embedding teks dan menggunakannya untuk membuat indeks penelusuran vektor. Anda sekarang siap menggunakan embedding teks di aplikasi Anda sendiri!
Langkah berikutnya/Pelajari lebih lanjut
Lihat referensi berikut untuk mendapatkan informasi selengkapnya tentang embedding teks dan penelusuran vektor:
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 04 April 2024
Lab Terakhir Diuji pada 04 April 2024
Hak cipta 2025 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.