Mit dem Skill-Logo zum Kurs Rich-Dokumente mit Gemini Multimodal und Multimodal RAG untersuchen weisen Sie fortgeschrittene Kenntnisse in folgenden Bereichen nach: Verwenden von multimodalen Prompts, um Informationen aus Text- und Bilddaten zu gewinnen; Erstellen einer Videobeschreibung und Abrufen von zusätzlichen, über das Video hinausgehenden Informationen unter Verwendung von Multimodalität mit Gemini; Erstellen von Metadaten von Dokumenten mit Text und Bildern; Ermitteln aller relevanten Textabschnitte und Drucken von Zitationen durch Nutzung von multimodaler Retrieval-Augmented Generation (RAG) mit Gemini.
Mit dem Skill-Logo „Praxisorientierte KI-Anwendungen mit Gemini und Imagen entwickeln“ weisen Sie Grundkenntnisse in folgenden Bereichen nach: Bilderkennung, Natural Language Processing, Bildgenerierung mit den leistungsstarken Gemini- und Imagen-Modellen von Google sowie Bereitstellen von Anwendungen auf der Vertex AI-Plattform.
Mit dem Skill-Logo Prompt-Design mit Vertex AI weisen Sie Grundkenntnisse in folgenden Bereichen nach: Prompt Engineering, Bildanalyse und multimodale generative Techniken in Vertex AI. Entdecken Sie, wie Sie wirksame Prompts erstellen, auf generativer KI basierende Ausgaben steuern und Gemini-Modelle in Marketing-Szenarien aus der Praxis anwenden.