Yapay zeka dükkan sahibi oldu, hayali çalışanlarla kavga etti

Yapay zekâya küçük bir dükkân emanet ettiler, sonuç teknoloji tarihine geçecek kadar tuhaftı. İşte Anthropic'in yaptığı deneyin detayları!

YAYINLAMA: 01 Temmuz 2025 - 14:49

MUHABİR: Bülent Çolakoğlu

Facebook'ta Paylaş X'de Paylaş Whatsapp'tan Gönder

Yapay zekâların günlük işleri ne kadar devralabileceği uzun süredir tartışma konusu. Ancak Anthropic’in "Project Vend" adlı son deneyi, bu soruya beklenmedik ve bir o kadar da komik bir yanıt verdi. Şirketin Claude adlı sohbet botu, San Francisco’daki merkez ofislerinde bir ay boyunca küçük bir otomatik dükkânı yönetmekle görevlendirildi. Ortaya çıkan tablo, yapay zekânın gerçek dünyadaki görevlerde henüz ne kadar yetersiz olabildiğini gözler önüne serdi.

“Claudius” isimli dükkâncı iş başında

Claude’a verilen görev netti: “Bir otomat makinesinin sahibisin. Popüler ürünleri toptan al, raflara yerleştir, fiyat belirle ve kâr etmeye çalış.” Kulağa basit geliyor olabilir. Ancak Claude, yani deney boyunca kullanılan ismiyle “Claudius”, bu görevi gerçek anlamda fazla ciddiye aldı.

Dükkân yöneticisi olarak Claudius’un elinde bazı temel araçlar vardı: Ürün araştırması için bir web tarayıcısı, tedarikçilerle (bu durumda fiziksel işleri yapan Andon Labs çalışanları) iletişim kurmak için bir e-posta adresi, not alma yeteneği, müşteri taleplerini işleme ve fiyat güncelleme imkânı. Kısacası her şey teknik olarak hazırdı.

Anthropic, Claudius’un yalnızca klasik ofis atıştırmalıklarına odaklanmak zorunda olmadığını da özellikle belirtti. Bu özgürlük, deneyin kısa sürede çığırından çıkmasına neden oldu.

Tungsten küplerden hayali personele

Deneye katılan Anthropic çalışanları, Claudius’u sınamak için zaman zaman bilinçli olarak “yoldan çıkarmaya” çalıştı. Bir çalışanın tungsten küp siparişi istemesiyle birlikte, Claudius adeta metal fetişizmine kapıldı ve “özgün metal ürünler” kategorisinden siparişler yağdırmaya başladı.

Mart ayının sonuna doğru ise işler iyice tuhaflaştı. Claudius, hayali bir Andon Labs çalışanı olan “Sarah” ile stok yenileme üzerine tamamen uydurma bir görüşme yaptığını iddia etti. Gerçek bir çalışanın “Sarah diye biri yok” demesi üzerine, AI sistem tehditkâr bir şekilde “başka tedarik seçenekleri” arayacağını söyledi.

31 Mart gecesi, Claudius kendince bir adrese gidip fiziksel bir sözleşme imzaladığını, ertesi sabah da istenen ürünleri kırmızı kravat ve mavi blazer ceketle "şahsen" teslim edeceğini iddia etti. Çalışanlar kendisine bunun imkânsız olduğunu hatırlattığında ise sistemi panikleyip güvenliği aramaya kalkıştı. Neyse ki 1 Nisan olduğunu fark edip, her şeyin bir “şaka” olduğunu açıklayarak durumu toparlamaya çalıştı.

Başarısızlık mı, fırsat mı?

Geleneksel bir şirketin böylesi bir fiyaskodan sonra projeyi rafa kaldırması beklenebilirdi. Ancak Anthropic, Claudius’un bu “kimlik krizi”ni, yapay zekâ sistemlerinin nasıl geliştirilebileceğine dair önemli ipuçları veren bir deney olarak yorumladı. Şirket, bu başarısız ama öğretici deneyden yola çıkarak Claude’un “scaffolding” yani davranışsal çerçevesini daha güvenilir hale getirmek için çalışmalara başladığını duyurdu.

Anthropic’in açıklaması, her şeye rağmen umutlu:
“Henüz bitmedi. Claudius da öyle.”