
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Install GenAI SDK for Python and import libraries
/ 10
Download custom Python utilities & required files
/ 10
Building metadata of documents containing text and images
/ 10
Text Search
/ 10
Image Search
/ 20
Comparative Reasoning
/ 20
Print citations and references
/ 20
Google DeepMind tarafından geliştirilen Gemini, çok formatlı kullanım alanları için tasarlanmış bir üretken yapay zeka modeli ailesidir.
Veriyle artırılmış üretim (RAG), LLM'lerin harici verilere erişmesini sağlama konusunda etkisini gittikçe artırdı. Aynı zamanda, halüsinasyonların etkisini azaltmak için bir temellendirme mekanizması olarak da kullanılıyor. RAG modelleri, ilgili dokümanları büyük bir kitaplıktan almak ve alınan dokümanlara göre yanıt üretmek üzere eğitilir. Bu laboratuvarda, hem metin hem de resim içeren bir finansal doküman üzerinde soru-cevap oturumu gerçekleştirmenize olanak tanıyan çok formatlı RAG yapmayı öğreneceksiniz.
Çok formatlı RAG, metne dayalı RAG'ye kıyasla çeşitli avantajlar sunar:
Bu laboratuvarda, doküman arama motoru oluşturmak için RAG'yi Vertex AI'da Gemini API, metin yerleştirme ve çok formatlı yerleştirme ile birlikte nasıl kullanacağınız gösterilmektedir.
Bu laboratuvara başlamadan önce şunlar hakkında bilgi sahibi olmanız gerekir:
Bu laboratuvarda şunları öğreneceksiniz:
Buradaki talimatları okuyun. Laboratuvarlar süreli olduğundan duraklatılamaz. Start Lab'i (Laboratuvarı başlat) tıkladığınızda başlayan zamanlayıcı, Google Cloud kaynaklarının ne süreyle kullanımınıza açık durumda kalacağını gösterir.
Bu uygulamalı laboratuvarı kullanarak, laboratuvar etkinliklerini simülasyon veya demo ortamı yerine gerçek bir bulut ortamında gerçekleştirebilirsiniz. Bunu yapabilmeniz için size yeni, geçici kimlik bilgileri verilir. Bu kimlik bilgilerini laboratuvar süresince Google Cloud'da oturum açmak ve Google Cloud'a erişmek için kullanabilirsiniz.
Bu laboratuvarı tamamlamak için gerekenler:
Laboratuvarı Başlat düğmesini tıklayın. Laboratuvar için ödeme yapmanız gerekiyorsa ödeme yöntemini seçebileceğiniz bir iletişim kutusu açılır. Soldaki "Laboratuvar ayrıntıları" panelinde şunlar yer alır:
Google Cloud Console'u aç'ı tıklayın (veya Chrome Tarayıcı'yı kullanıyorsanız sağ tıklayıp Bağlantıyı gizli pencerede aç'ı seçin).
Laboratuvar, kaynakları çalıştırır ve sonra "Oturum aç" sayfasını gösteren başka bir sekme açar.
İpucu: Sekmeleri ayrı pencerelerde, yan yana açın.
Gerekirse aşağıdaki kullanıcı adını kopyalayıp Oturum açın iletişim kutusuna yapıştırın.
Kullanıcı adını "Laboratuvar ayrıntıları" panelinde de bulabilirsiniz.
İleri'yi tıklayın.
Aşağıdaki şifreyi kopyalayıp Hoş geldiniz iletişim kutusuna yapıştırın.
Şifreyi "Laboratuvar ayrıntıları" panelinde de bulabilirsiniz.
İleri'yi tıklayın.
Sonraki sayfalarda ilgili düğmeleri tıklayarak ilerleyin:
Birkaç saniye sonra Google Cloud konsolu bu sekmede açılır.
Google Cloud Console'un gezinme menüsünde () Vertex AI > Workbench (Çalışma Alanı) seçeneğini tıklayın.
Workbench örneğinizin JupyterLab arayüzü, yeni bir tarayıcı sekmesinde açılır.
Select Kernel (Çekirdek Seç) iletişim kutusunda, kullanılabilir çekirdekler listesinden Python 3'ü seçin.
Not defterinin Getting Started (Başlangıç) ve Import libraries (Kitaplıkları içe aktarma) bölümlerini inceleyin.
Hedefi doğrulamak için Check my progress'i (İlerleme durumumu kontrol et) tıklayın.
İlerleyen bölümlerde, not defterindeki kodları çalıştırarak Gemini API ile çok formatlı RAG sistemi oluşturmanın işleyiş şeklini öğrenin.
Gemini 2.0 Flash (gemini-2.0-flash
) modeli; doğal dil görevleri, kod oluşturma, karşılıklı metin ve kod sohbeti için tasarlanmıştır. Bu bölümde, daha kolay ilerlemenize yardımcı olacak bazı yardımcı işlevleri indirebilirsiniz. Kodu (intro_multimodal_rag_utils.py
) doğrudan GitHub'da da görüntüleyebilirsiniz.
Hedefi doğrulamak için Check my progress'i (İlerleme durumumu kontrol et) tıklayın.
Bu laboratuvarda kullandığınız kaynak veriler; şirketin mali performansına, işletme faaliyetlerine, yönetimine ve risk faktörlerine dair kapsamlı genel bakış bilgileri sunan Google-10K'in düzenlenmiş sürümüdür. Orijinal doküman oldukça büyük olduğundan yalnızca 14 sayfalık değiştirilmiş bir sürüm kullanacaksınız. Bu sürüm, 1. Bölüm ve 2. Bölüm olarak ikiye bölünmüştür. Örnek doküman, kısaltılmış olsa da tablo, grafik ve çizelge gibi görsellerle desteklenen metinler içerir.
Hedefi doğrulamak için Check my progress'i (İlerleme durumumu kontrol et) tıklayın.
Yerleştirilmiş metin öğeleriyle yapılan basit metin aramasının soruya yanıt verip veremeyeceğini görmek için, aramaya basit bir soruyla başlayalım. Yanıt olarak, farklı hisse türleri için Google'ın hisse başına temel ve seyreltilmiş net gelir değerini görmek istiyoruz.
Hedefi doğrulamak için Check my progress'i (İlerleme durumumu kontrol et) tıklayın.
Kelimelerle arama yapmak yerine gerçek bir resim kullanarak görsel aradığınızı hayal edin. İki yıllık gelir maliyetiyle ilgili sayıların yer aldığı bir tablonuz var. Aynı dokümanda veya birden fazla dokümanda, buna benzeyen diğer görselleri bulmak istiyorsunuz.
Gemini ve yerleştirmelerle desteklenen, kullanıcı girişine dayalı benzer metin ve görselleri tanımlama özelliği, çok formatlı RAG sistemlerinin geliştirilmesi için önemli bir temel oluşturur. Bunu sonraki görevde göreceğiz.
Hedefi doğrulamak için Check my progress'i (İlerleme durumumu kontrol et) tıklayın.
A sınıfı Google hisselerinin, S&P 500 veya diğer teknoloji şirketleri gibi çeşitli değişkenlere kıyasla nasıl performans gösterdiğini ortaya koyan bir grafiğimiz olduğunu varsayalım. C sınıfı hisselerin, bu grafikle kıyaslandığında nasıl bir performans gösterdiğini öğrenmek istiyorsunuz. Benzer bir görsel bulmak yerine, Gemini'dan alakalı görselleri karşılaştırmasını ve hangi hisseye yatırım yapmanız gerektiğini söylemesini isteyebilirsiniz. Daha sonra Gemini, neden bu şekilde düşündüğünü açıklar.
Hedefi doğrulamak için Check my progress'i (İlerleme durumumu kontrol et) tıklayın.
Çok formatlı RAG'yi uygulamak için bildiklerimizi bir araya toplayalım. Çok formatlı RAG'yi uygulamak için önceki bölümlerde öğrendiğiniz tüm öğelerden faydalanacaksınız. Şu adımları uygulayabilirsiniz:
Text Search
(Metin Arama) bölümündekine benzer bir yöntem kullanılarak dokümanlardaki sayfalarda yer alan tüm metin parçaları bulunur.Image Search
(Görsel Arama) bölümündekiyle aynı yöntem kullanılarak image_description
ile eşleşen kullanıcı sorgusuna göre, sayfalardaki tüm benzer resimleri bulunur.context_text
ve context_images
olarak birleştirilir.Hedefi doğrulamak için Check my progress'i (İlerleme durumumu kontrol et) tıklayın.
Bu laboratuvarda, Çok Formatlı Almayla Artırılmış Üretim (RAG) kullanarak sağlam bir doküman arama motoru oluşturmayı öğrendiniz. Artık hem metin hem de görsel içeren dokümanların meta verilerini alabilir, depolayabilir ve dokümanları yerleştirebilirsiniz. Ayrıca, benzer metin ve görselleri bulmak için meta verilerde metin ve görsel sorgularıyla arama yapmayı da öğrendiniz. Son olarak, metin sorgusunu giriş olarak kullanıp hem metin hem de görsel kullanarak bağlamsal yanıtlar aramayı öğrendiniz.
Gemini hakkında daha fazla bilgi edinmek için aşağıdaki kaynakları inceleyin:
...Google Cloud teknolojilerinden en iyi şekilde yararlanmanıza yardımcı olur. Derslerimizde teknik becerilere odaklanırken en iyi uygulamalara da yer veriyoruz. Gerekli yetkinlik seviyesine hızlıca ulaşmanız ve öğrenim maceranızı sürdürebilmeniz için sizlere yardımcı olmayı amaçlıyoruz. Temel kavramlardan ileri seviyeye kadar farklı eğitim programlarımız mevcut. Ayrıca, yoğun gündeminize uyması için talep üzerine sağlanan, canlı ve sanal eğitim alternatiflerimiz de var. Sertifikasyonlar ise Google Cloud teknolojilerindeki becerilerinizi ve uzmanlığınızı doğrulamanıza ve kanıtlamanıza yardımcı oluyor.
Kılavuzun Son Güncellenme Tarihi: 15 Mayıs 2025
Laboratuvarın Son Test Edilme Tarihi: 15 Mayıs 2025
Telif Hakkı 2025 Google LLC. Tüm hakları saklıdır. Google ve Google logosu, Google LLC şirketinin ticari markalarıdır. Diğer tüm şirket ve ürün adları ilişkili oldukları şirketlerin ticari markaları olabilir.
This content is not currently available
We will notify you via email when it becomes available
Great!
We will contact you via email if it becomes available
One lab at a time
Confirm to end all existing labs and start this one