Menginspeksi Dokumen Multimedia dengan Multimodalitas Gemini dan RAG Multimodal
1 jam 45 menit
Menengah
Menyelesaikan badge keahlian tingkat menengah Menginspeksi Dokumen Multimedia dengan Multimodalitas Gemini dan RAG Multimodal untuk menunjukkan keterampilan dalam hal berikut ini: menggunakan prompt multimodal untuk mengekstrak informasi dari data teks dan visual dengan menghasilkan deskripsi video, dan mengambil informasi tambahan di luar video menggunakan multimodalitas dengan Gemini; membangun metadata dokumen yang berisi teks dan gambar dengan mendapatkan semua potongan teks yang relevan, dan mencetak kutipan dengan menggunakan Multimodal Retrieval Augmented Generation (RAG) dengan Gemini.