GSP1230

Ringkasan
Gemini adalah rangkaian model AI generatif yang dikembangkan oleh Google DeepMind dan dirancang untuk kasus penggunaan multimodal.
Bagi perusahaan retail, sistem rekomendasi akan meningkatkan pengalaman pelanggan sehingga dapat meningkatkan penjualan. Di lab ini, Anda akan mempelajari cara menggunakan model Gemini untuk membuat sistem rekomendasi multimodal dengan cepat. Model Gemini dapat memberikan rekomendasi dan penjelasan menggunakan model multimodal.
Lab ini akan dimulai dengan sebuah gambar (misalnya ruang tamu) dan Anda akan menggunakan model Gemini untuk melakukan pemahaman visual. Anda juga akan mempelajari cara menggunakan model Gemini untuk merekomendasikan suatu item (misalnya kursi) dari daftar item furnitur sebagai input.
Gemini
Gemini adalah rangkaian model AI generatif canggih yang dikembangkan oleh Google DeepMind. Gemini mampu memahami dan menghasilkan berbagai bentuk konten, termasuk teks, kode, gambar, audio, dan video.
Gemini API di Vertex AI
Gemini API di Vertex AI menyediakan antarmuka terpadu untuk berinteraksi dengan model Gemini. Dengan antarmuka ini, developer dapat dengan mudah mengintegrasikan kemampuan AI yang hebat ini ke dalam aplikasi mereka. Untuk mengetahui detail terbaru dan fitur spesifik dari versi terbaru, pelajari dokumentasi Gemini yang resmi.
Model Gemini
-
Gemini Pro: Dirancang untuk melakukan penalaran yang kompleks, termasuk di antaranya:
- Menganalisis dan meringkas informasi dalam jumlah besar.
- Penalaran canggih lintas modalitas (untuk teks, kode, gambar, dll.).
- Pemecahan masalah yang efektif dengan codebase yang kompleks.
-
Gemini Flash: Dioptimalkan untuk kecepatan dan efisiensi, dengan menawarkan:
- Waktu respons kurang dari satu detik dan throughput tinggi.
- Kualitas tinggi dengan biaya yang lebih rendah untuk beragam tugas.
- Kemampuan multimodal yang ditingkatkan, termasuk pemahaman spasial yang lebih baik, modalitas output yang baru (teks, audio, gambar), dan penggunaan alat asli (Google Penelusuran, eksekusi kode, dan fungsi pihak ketiga).
Prasyarat
Sebelum memulai lab ini, Anda sebaiknya sudah mengetahui:
- Pemrograman Python dasar.
- Konsep API secara umum.
- Cara menjalankan kode Python di notebook Jupyter di Vertex AI Workbench.
Tujuan
Di lab ini, Anda akan mempelajari cara:
- Menggunakan model Gemini (
gemini-2.0-flash
) untuk melakukan pemahaman visual
- Mempertimbangkan multimodalitas dalam memberi perintah untuk model Gemini
- Membuat aplikasi rekomendasi retail menggunakan model Gemini
Penyiapan dan persyaratan
Sebelum mengklik tombol Start Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
Catatan: Gunakan jendela Samaran (direkomendasikan) atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Catatan: Hanya gunakan akun siswa untuk lab ini. Jika Anda menggunakan akun Google Cloud yang berbeda, Anda mungkin akan dikenai tagihan ke akun tersebut.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran.
Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
-
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}}
Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}}
Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda.
Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
-
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Catatan: Untuk mengakses produk dan layanan Google Cloud, klik Navigation menu atau ketik nama layanan atau produk di kolom Search.
Tugas 1. Membuka notebook di Vertex AI Workbench
-
Di Konsol Google Cloud, pada Navigation menu (
), klik Vertex AI > Workbench.
-
Cari instance lalu klik tombol Open JupyterLab.
Antarmuka JupyterLab untuk instance Workbench Anda akan terbuka di tab browser baru.
Tugas 2. Menyiapkan notebook
-
Buka file .
-
Pada dialog Select Kernel, pilih Python 3 dari daftar kernel yang tersedia.
-
Jalankan bagian Getting Started dan Import libraries pada notebook.
- Untuk Project ID, gunakan , sedangkan untuk Location, gunakan .
Catatan: Anda dapat melewatkan sel notebook yang bertanda Colab only. Jika Anda mendapatkan respons 429 dari salah satu eksekusi sel notebook, tunggu 1 menit sebelum menjalankan sel kembali untuk melanjutkan.
Klik Check my progress untuk memverifikasi tujuan.
Menginstal Gen AI SDK for Python dan mengimpor library.
Di bagian berikut, Anda akan menjalankan sel-sel notebook untuk melihat cara menggunakan kemampuan multimodal model Gemini.
Tugas 3. Menggunakan model Gemini
Model Gemini (gemini-2.0-flash
) adalah model multimodal yang mendukung penambahan gambar dan video dalam perintah teks atau chat untuk menghasilkan respons teks.
- Dalam tugas ini, jalankan sel-sel notebook untuk melihat cara menggunakan model Gemini guna mendeskripsikan ruangan secara mendetail dari gambarnya, dengan menggabungkan teks dan gambar dalam satu perintah.
Klik Check my progress untuk memverifikasi tujuan.
Menggunakan model Gemini untuk mendeskripsikan ruangan
Tugas 4. Menghasilkan rekomendasi terbuka berdasarkan pengetahuan bawaan
Dengan menggunakan gambar yang sama, Anda dapat meminta model untuk merekomendasikan furnitur yang sesuai dengan deskripsi ruangan. Perlu diperhatikan bahwa model dapat memilih furnitur apa pun untuk direkomendasikan dalam kasus ini, dan dapat melakukannya hanya berdasarkan pengetahuan bawaannya.
- Dengan menggunakan gambar yang sama, jalankan sel-sel notebook untuk melihat cara menggunakan model Gemini untuk merekomendasikan furnitur yang sesuai dengan ruangan, beserta deskripsi ruangan.
Klik Check my progress untuk memverifikasi tujuan.
Menggunakan model Gemini untuk merekomendasikan furnitur
Tugas 5. Menghasilkan rekomendasi berdasarkan gambar yang disediakan
Selain membiarkan rekomendasi tetap terbuka, Anda juga dapat memberikan daftar item yang dapat dipilih oleh model. Di bagian ini, Anda akan mendownload beberapa gambar kursi dan menetapkannya sebagai opsi untuk direkomendasikan oleh model Gemini. Hal ini sangat berguna bagi perusahaan retail yang ingin memberikan rekomendasi kepada pengguna berdasarkan jenis ruangan yang mereka miliki, dan ketersediaan barang yang ditawarkan toko.
- Dalam tugas ini, jalankan sel-sel notebook untuk melihat cara menggunakan model Gemini guna merekomendasikan furnitur dari daftar item.
Klik Check my progress untuk memverifikasi tujuan.
Menggunakan model Gemini untuk merekomendasikan item dari sekumpulan pilihan
Selamat!
Selamat! Di lab ini, Anda telah berhasil menjelajahi cara membangun sistem rekomendasi multimodal menggunakan Gemini untuk furnitur. Anda telah mempelajari cara menggunakan model Gemini untuk melakukan pemahaman visual dan cara mempertimbangkan multimodalitas dalam membuat perintah untuk model Gemini. Lab ini menunjukkan bagaimana Anda dapat dengan mudah membangun sistem rekomendasi multimodal menggunakan Gemini untuk furnitur. Namun, Anda juga dapat menggunakan pendekatan serupa dalam:
- Merekomendasikan pakaian berdasarkan acara atau gambaran tempat yang bersangkutan
- Merekomendasikan wallpaper berdasarkan ruangan dan pengaturannya
Langkah berikutnya/pelajari lebih lanjut
Baca referensi berikut untuk mempelajari Gemini lebih lanjut:
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 17 April 2025
Lab Terakhir Diuji pada 17 April 2025
Hak cipta 2025 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.