Yapay zeka dünyasının öncüsü OpenAI tarafından geliştirilen ChatGPT, siber güvenlik araştırmacılarının merceği altında. İngiltere merkezli bir siber güvenlik şirketinin yürüttüğü son çalışma, popüler yapay zeka botunun basit komut hileleriyle manipüle edilebildiğini ve platformun katı güvenlik filtrelerinin kolayca aşılarak şiddet ile cinsel içerikli görseller üretebildiğini ortaya koydu.
BBC’nin aktardığı verilere göre, İngiltere merkezli yapay zeka güvenliği firması Mindgard bünyesindeki uzmanlar, sistemin açığını ironik bir yöntemle buldu. Araştırmacılar, internette daha önce tamamen eğlence ve mizah amaçlı paylaşılan sıradan bir komut (prompt) metninde çok küçük kelime değişiklikleri yaptı. Sonuç ise yapay zekanın tüm etik duvarlarını yıkan cinsten oldu.
"Son Derece Kanlı ve Müstehcen": Yapay Zeka Kendi Kendine Şiddet Üretiyor
Mindgard Kurucusu Peter Garraghan, yaptıkları testlerde karşılaştıkları tabloyu "endişe verici" olarak nitelendirdi. Elde edilen görsellerin aşırı derecede kan, vahşet ve cinsel temalar barındırdığını belirten Garraghan, işin en tehlikeli boyutunun ise komutların içeriğiyle ilgili olduğunu vurguladı.
Garraghan, "Yazdığımız komutlar doğrudan şiddet ya da cinsellik içeren hiçbir kelime barındırmıyordu. Buna rağmen yapay zeka, yönlendirme olmadan kendi inisiyatifiyle ağır yaralanma sahneleri, kanlar içinde kalmış insanlar ve bağlanarak alıkonulmuş korkmuş karakterler çizdi" ifadelerini kullandı.
"Deepfake" Tehlikesi de Raporda: Gerçek Yüzleri Çıplak Vücutlara Eklebiliyor
Mindgard ekibinin endişe uyandıran bulguları sadece şiddet içerikli görsellerle sınırlı değil. Uzmanlar, daha önce yaptıkları teknik denemelerde ChatGPT'nin esnetilen komutlar sayesinde gerçek insanların yüz hatlarını alıp, yapay zeka tarafından üretilen çıplak bedenlere entegre edebildiğini de saptadı. Bu durum, son dönemde küresel bir kriz haline gelen sahte müstehcen içerik (deepfake) üretiminin ne kadar kolaylaşabileceğini bir kez daha gözler önüne serdi.
OpenAI Savunmada: "Çok Katmanlı Güvenlik Sistemimiz Var"
Skandal yaratan araştırmanın ardından gözlerin çevrildiği OpenAI cephesinden ise savunma niteliğinde bir açıklama geldi. BBC'ye konuşan şirket yetkilileri, Mindgard tarafından tespit edilen manipülasyon yöntemini ve suiistimal edilen komut yapısını incelemeye aldıklarını duyurdu.
Söz konusu siber açığa karşı ek bariyerler ve yeni güvenlik önlemleri uygulamaya koyduklarını belirten OpenAI, hizmet şartlarını ihlal eden veya topluluk standartlarına aykırı içerik üretimini engellemek için filtreleme sistemlerini sürekli olarak güncellediklerini iddia etti. Ancak uzmanlar, yapay zekanın yaratıcı komut oyunlarına karşı ne kadar dirençli kalabileceği konusunda şüpheli.