04
Inspect Rich Documents with Gemini Multimodality and Multimodal RAG
04
Inspect Rich Documents with Gemini Multimodality and Multimodal RAG
These skills were generated by AI. Do you agree this course teaches these skills?
Mit dem Skill-Logo zum Kurs Inspect Rich Documents with Gemini Multimodality and Multimodal RAG weisen Sie fortgeschrittene Kenntnisse in folgenden Bereichen nach: Verwenden von multimodalen Prompts, um Informationen aus Text- und Bilddaten zu gewinnen; Erstellen einer Videobeschreibung und Abrufen von zusätzlichen, über das Video hinausgehenden Informationen unter Verwendung von Multimodalität mit Gemini; Erstellen von Metadaten von Dokumenten mit Text und Bildern; Ermitteln aller relevanten Textabschnitte und Drucken von Zitationen durch Nutzung von multimodaler Retrieval-Augmented Generation (RAG) mit Gemini.
Ein Skill-Logo ist ein exklusives digitales Abzeichen, das von Google Cloud ausgestellt wird und Ihre Kenntnisse über unsere Produkte und Dienste belegt. In diesem Zusammenhang wird auch die Fähigkeit bewertet, Ihr Wissen in einer interaktiven praxisnahen Geschäftssituation anzuwenden. Absolvieren Sie eine kursspezifische Aufgabenreihe und die Challenge-Lab-Prüfung, um ein Skill-Logo zu erhalten, das Sie in Ihrem Netzwerk posten können.
Kursinformationen
Ziele
- Mithilfe der Vertex AI Gemini API Informationen und Text aus Text-, Bild- und Videoprompts generieren.
- Metadaten von Dokumenten, die sowohl Text als auch Bilder enthalten, extrahieren, speichern und durchsuchen.
- Multimodalität und multimodale RAG mit Gemini in einem Marketingszenario aus der Praxis anwenden.
Verfügbare Sprachen
English, Deutsch, español (Latinoamérica), bahasa Indonesia, 日本語, 한국어, português (Brasil), 简体中文, 繁體中文 und Türkçe