GSP1275

Ringkasan
Partitur Musik adalah bentuk utama notasi musik yang digunakan oleh komposer dan penyanyi di seluruh dunia. Halaman ini berisi informasi tentang lirik, nada, ritme, komposer, penulis teks, tanggal penggubahan, dan lain-lain. Di lab ini, Anda akan mempelajari cara mengekstrak metadata terstruktur dari PDF partitur musik menggunakan Gemini.
Gemini
Gemini adalah rangkaian model AI generatif canggih yang dikembangkan oleh Google DeepMind. Gemini mampu memahami dan menghasilkan berbagai bentuk konten, termasuk teks, kode, gambar, audio, dan video.
Gemini API di Vertex AI
Gemini API di Vertex AI menyediakan antarmuka terpadu untuk berinteraksi dengan model Gemini. Dengan antarmuka ini, developer dapat dengan mudah mengintegrasikan kemampuan AI yang hebat ini ke dalam aplikasi mereka. Untuk mengetahui detail terbaru dan fitur spesifik dari versi terbaru, pelajari dokumentasi Gemini yang resmi.
Model Gemini
-
Gemini Pro: Dirancang untuk melakukan penalaran yang kompleks, termasuk di antaranya:
- Menganalisis dan meringkas informasi dalam jumlah besar.
- Penalaran canggih lintas modalitas (untuk teks, kode, gambar, dll.).
- Pemecahan masalah yang efektif dengan codebase yang kompleks.
-
Gemini Flash: Dioptimalkan untuk kecepatan dan efisiensi, dengan menawarkan:
- Waktu respons kurang dari satu detik dan throughput tinggi.
- Kualitas tinggi dengan biaya yang lebih rendah untuk beragam tugas.
- Kemampuan multimodal yang ditingkatkan, termasuk pemahaman spasial yang lebih baik, modalitas output yang baru (teks, audio, gambar), dan penggunaan alat asli (Google Penelusuran, eksekusi kode, dan fungsi pihak ketiga).
Prasyarat
Sebelum memulai lab ini, Anda sebaiknya sudah mengetahui:
- Pemrograman Python dasar.
- Konsep API secara umum.
- Cara menjalankan kode Python di notebook Jupyter di Vertex AI Workbench.
Tujuan
Di lab ini, Anda akan mempelajari cara:
- Menginstal Vertex AI SDK for Python.
- Mengekstrak metadata dari PDF partitur musik menggunakan Gemini.
Penyiapan dan persyaratan
Sebelum mengklik tombol Start Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
Catatan: Gunakan jendela Samaran (direkomendasikan) atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Catatan: Hanya gunakan akun siswa untuk lab ini. Jika Anda menggunakan akun Google Cloud yang berbeda, Anda mungkin akan dikenai tagihan ke akun tersebut.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran.
Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
-
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}}
Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}}
Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda.
Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
-
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Catatan: Untuk mengakses produk dan layanan Google Cloud, klik Navigation menu atau ketik nama layanan atau produk di kolom Search.
Tugas 1. Membuka notebook di Vertex AI Workbench
-
Di Konsol Google Cloud, pada Navigation menu (
), klik Vertex AI > Workbench.
-
Cari instance lalu klik tombol Open JupyterLab.
Antarmuka JupyterLab untuk instance Workbench Anda akan terbuka di tab browser baru.
Tugas 2. Menyiapkan notebook
-
Buka file .
-
Pada dialog Select Kernel, pilih Python 3 dari daftar kernel yang tersedia.
-
Jalankan bagian Getting Started dan Import libraries pada notebook.
- Untuk Project ID, gunakan , sedangkan untuk Location, gunakan .
Catatan: Anda dapat melewatkan sel notebook yang bertanda Colab only. Jika Anda mendapatkan respons 429 dari salah satu eksekusi sel notebook, tunggu 1 menit sebelum menjalankan sel kembali untuk melanjutkan.
Klik Check my progress untuk memverifikasi tujuan.
Menginstal paket dan mengimpor library.
Klik Check my progress untuk memverifikasi tujuan.
Memuat model Gemini.
Tugas 3. Mengekstrak Metadata Terstruktur dari PDF Partitur Musik
Di bagian ini, Anda akan menggunakan buku musik klasik populer 24 Italian Songs and Arias of the 17th and 18th Centuries, dan mengekstrak metadata tentang setiap lagu di buku tersebut.
Klik Check my progress untuk memverifikasi tujuan.
Mengekstrak Metadata Terstruktur dari PDF Partitur Musik.
Identifikasi Lagu dengan Audio
Sekarang, mari kita coba sesuatu yang lebih menantang, mengidentifikasi lagu yang dimainkan berdasarkan partitur musik. Kami memiliki klip audio Holt Skinner yang menyanyikan salah satu lagu dalam buku tersebut, dan Anda akan meminta Gemini untuk mengidentifikasinya berdasarkan PDF partitur musik.
- Jalankan bagian Song Identification with Audio pada notebook.
Klik Check my progress untuk memverifikasi tujuan.
Identifikasi Lagu dengan Audio.
Mengedit Metadata PDF
Selanjutnya, Anda akan menggunakan output dari Gemini untuk mengedit metadata PDF yang berisi satu lagu, sehingga memudahkan Anda mengatur file ini dalam aplikasi partitur musik.
Anda akan sedikit menyesuaikan prompt dan menyetel response_mime_type
untuk mendapatkan respons dalam format JSON.
- Jalankan bagian Edit PDF Metadata pada notebook.
Klik Check my progress untuk memverifikasi tujuan.
Mengedit Metadata PDF.
Selamat!
Selamat! Di lab ini, Anda telah mempelajari cara mengekstrak metadata terstruktur dari PDF partitur musik menggunakan Gemini.
Langkah berikutnya/pelajari lebih lanjut
Baca referensi berikut untuk mempelajari Gemini lebih lanjut:
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 20 Maret 2025
Lab Terakhir Diuji pada 20 Mei 2025
Hak cipta 2025 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.