Oyun Arenasında Yeni Bir Test Alanı: Yapay Zekâlar ve Pokémon
Yapay zekâ dünyasında rekabet sadece algoritmalarla değil, artık Pokémon arenalarında da yaşanıyor. Google DeepMind ve Anthropic, son yapay zekâ modellerinin klasik Pokémon oyunlarında nasıl davrandığını inceliyor. Bu süreç, bilimsel olduğu kadar eğlenceli sonuçlar da doğuruyor.
Google’ın yeni yayımladığı bir rapora göre, Gemini 2.5 Pro modeli, Pokémon karakterleri ölmek üzereyken "panikleme" eğilimi gösteriyor. Bu durum, modelin karar alma becerisinde gözle görülür bir düşüşe yol açıyor. Raporda bu durum, “modelin muhakeme yeteneğinde niteliksel bir bozulma” olarak tanımlanıyor.
Yapay Zekâ Oyunlarda İnsan Gibi Düşünebilir mi?
Yapay zekâların oyun oynama süreçleri, onların nasıl düşündüğüne dair ilginç ipuçları sunuyor. Twitch üzerinde yayımlanan “Gemini Pokémon Oynuyor” ve “Claude Pokémon Oynuyor” isimli canlı yayınlar, izleyicilere modellerin karar mekanizmalarını doğal dilde gözlemleme fırsatı veriyor.
Ancak bu modeller henüz oyunları başarıyla tamamlayacak seviyede değil. Gemini’nin bir oyunu bitirmesi yüzlerce saat sürebiliyor, oysa bir çocuk bu süreci çok daha kısa zamanda tamamlayabiliyor.
Asıl dikkat çekici olan, yapay zekânın oyunu nasıl oynadığı. Gemini 2.5 Pro, oyunun ilerleyen bölümlerinde sık sık panikleyerek bazı araçları kullanmayı bırakıyor. Bu da modelin kararlarının, baskı altındaki bir insanın yaptığı hatalı tercihlere benzemesine neden oluyor.

Claude’un Oyundaki ‘İntihar’ Girişimi ve Mantık Hataları
Anthropic’in Claude modeli de benzer şekilde garip davranışlar sergiliyor. Mt. Moon adlı mağarada sıkışıp kalan Claude, tüm Pokémon'larını kasıtlı olarak bayıltarak bir sonraki kasabaya geçmeyi planladı. Ancak oyun mekaniği böyle çalışmıyor; bu hamle Claude’un karakterini en son Pokémon Merkezi’ne geri gönderdi.
Bu, seyirciler tarafından endişeyle izlenen bir "dijital intihar" senaryosuna dönüştü. Claude’un bu hatalı çıkarımı, yapay zekânın çevresel kuralları anlamakta hâlâ zorluk çektiğini gösteriyor.
Zekâsını Araçlara Dönüştüren Gemini
Tüm bu eksiklerine rağmen, Gemini bazı alanlarda insanlardan daha başarılı olabiliyor. Özellikle bulmaca çözme konusunda etkileyici performanslar sergiliyor. Victory Road'daki karmaşık boulder (kaya) bulmacalarında, yalnızca fiziksel açıklamalar ve geçerli yollarla ilgili yönergelerle Gemini, bu engelleri tek seferde aşmayı başardı.
Google, Gemini 2.5 Pro’nun bu araçları büyük ölçüde kendi başına geliştirdiğini ve gelecekte tamamen bağımsız olarak bu tür çözüm araçları yaratabileceğini öne sürüyor.
Yapay Zekânın Psikolojisi: “Panik Yapma” Modülü Yakında mı?
Gemini’nin panik tepkileri, izleyicilerin bile dikkatini çekecek kadar belirgin hale geldi. Google’ın değerlendirmelerine göre, bu davranışlar modelin sadece teknik değil, insansı yönleri de taklit etmeye başladığını gösteriyor.
Kim bilir, belki de bir sonraki aşamada Gemini, kendine “panik yapma” modülü geliştirir.