Çoklu Ajan Yapısıyla Yeni Bir Zekâ Anlayışı
Google’ın aylık 250 dolarlık Ultra abonelik paketine dahil olan kullanıcılar, bugünden itibaren Gemini 2.5 Deep Think’e erişebilecek. İlk kez Mayıs 2025’te Google I/O etkinliğinde tanıtılan model, şirketin kamuya açık ilk çoklu ajan yapay zekâ sistemi olma özelliğini taşıyor. Bu sistem, bir soruyu çözmek için aynı anda birden fazla yapay zekâ ajanını devreye sokarak daha derinlikli ve başarılı yanıtlar sunmayı hedefliyor.
Bu yaklaşımın pratikteki başarısı da dikkat çekici: Google, bu sistemin bir versiyonunu 2025 Uluslararası Matematik Olimpiyatı’nda (IMO) altın madalya kazanmak için kullandığını açıkladı.
Akademik Kullanıma Açılan Derin Düşünme Modeli
Google, olimpiyat başarısında kullanılan özel modeli ise şimdilik yalnızca seçili akademisyen ve matematikçilere sunuyor. Bu versiyon, tüketiciye dönük yapay zekâ çözümlerinden farklı olarak saniyeler ya da dakikalar yerine saatler süren akıl yürütme süreçleriyle çalışıyor. Şirketin amacı, bu modelin araştırmalarda nasıl bir katkı sağlayabileceğini görmek ve akademik geri bildirimlerle sistemi daha da geliştirmek.
Yeni Nesil Performans Standartları
Gemini 2.5 Deep Think’in yalnızca geleneksel modellerden daha güçlü değil, aynı zamanda birçok benchmark testinde açık ara önde olduğu belirtiliyor. Özellikle yapay zekânın insan benzeri düşünme becerilerini ölçen Humanity’s Last Exam (HLE) testinde yüzde 34,8 başarı oranına ulaşarak rakiplerini geride bıraktı. Karşılaştırmak gerekirse, xAI’ın Grok 4 modeli yüzde 25,4, OpenAI’ın o3 modeli ise yalnızca yüzde 20,3 puan alabildi.
Kodlama becerilerini ölçen LiveCodeBench6 testinde de Google’ın yeni modeli yüzde 87,6’lık başarı oranıyla zirvede yer aldı. Grok 4 burada yüzde 79, OpenAI o3 ise yüzde 72 oranında kaldı.
Arayüz, Araç Desteği ve Yaratıcılık
Gemini 2.5 Deep Think, sadece doğru cevabı bulmakla kalmıyor; aynı zamanda kullanıcıya uzun, detaylı ve görsel olarak daha estetik yanıtlar sunuyor. Google’ın açıklamasına göre model, web geliştirme gibi yaratıcı görevlerde diğer modellere kıyasla daha etkileyici sonuçlar üretebiliyor.
Model ayrıca otomatik olarak kod çalıştırma, Google Arama gibi araçları kullanabiliyor. Bu da onu yalnızca bir sohbet robotu olmaktan çıkarıp, gerçek bir dijital araştırma asistanına dönüştürüyor.
Çoklu Ajan Yarışı Kızışıyor
Google’ın dışında, OpenAI, xAI ve Anthropic gibi öncü yapay zekâ şirketleri de çoklu ajan sistemlere yönelmiş durumda. Elon Musk’ın xAI girişimi Grok 4 Heavy modeliyle benzer iddialarda bulunurken, OpenAI’ın da altın madalya kazanan, henüz halka sunulmayan modelinin çoklu ajan tabanlı olduğu ortaya çıktı. Anthropic ise Research Agent adlı sistemiyle akademik araştırmalar için bu yaklaşımı benimsiyor.