Yeni Birlik Gazetesi
Yeni Birlik Gazetesi Teknoloji Genie 3 ile AI videolar artık bir kaç saniye ile sınırlı kalmayacak

Genie 3 ile AI videolar artık bir kaç saniye ile sınırlı kalmayacak

Google DeepMind, Genie 3 ile dakikalar süren etkileşimli 3D simülasyonlar oluşturabilen yeni bir dünya modeli geliştirdi.

MUHABİR: Bülent Çolakoğlu

Google DeepMind, yapay zeka alanındaki sınırları zorlayan yeni nesil bir dünya modeli olan Genie 3'ü tanıttı. Bu model, kullanıcıdan alınan metin komutlarıyla saniyeler yerine dakikalar süren 3D sanal ortamlar yaratabiliyor. Üstelik, bu üretim sırasında sahnenin tutarlılığını koruyarak, gerçekçi bir simülasyon sağlıyor. DeepMind yöneticisi Shlomi Fruchter, Genie 3’ü “gerçek zamanlı etkileşimli, genel amaçlı bir dünya modeli” olarak tanımlıyor.

Yeni Nesil Sahne Üretimi ve Gelişmiş Çözünürlük

Genie 3'ün en dikkat çekici yeniliği, önceki sürümde 10-20 saniye arasında sınırlı olan sahne üretim süresini dakikalar seviyesine çıkarabilmesi. Ayrıca çözünürlük de 720p'ye yükseltilerek daha net ve detaylı simülasyonlar sunuluyor. Bu gelişmeler, özellikle etkileşimli 3D simülasyonları ve sanal ortamları kullanan teknolojiler için büyük bir adım anlamına geliyor.

"Promptable World Events" ile Sadece Kelimelerle Değişim

Genie 3'ün sunduğu bir diğer yenilik ise "promptable world events" özelliği. Bu özellik, kullanıcıların veya eğitimdeki yapay ajanların sahneyi değiştirmelerini veya yeni unsurlar eklemelerini sadece birkaç kelimeyle yapmalarına olanak tanıyor. Örneğin, bir dağda kayak yapan bir kişinin yanına, metin komutuyla geyik sürüsü eklenebiliyor. Bu tür etkileşimler, otonom araçların beklenmedik durumlara nasıl tepki vereceğini test etmek için oldukça kullanışlı.

Fiziksel Tutarlılık ve Uzun Süreli Öğrenme

Genie 3’ün en önemli özelliklerinden biri de fiziksel tutarlılığı koruması. Model, önceki kareleri hatırlayarak nesnelerin hareketini ve çevreyle etkileşimlerini gerçekçi şekilde sürdürüp, değişen sahnelerde tutarlı bir deneyim sunuyor. Bu özellik, yapay ajanların uzun süreli öğrenme süreçlerinde, sahnedeki değişiklikleri takip etmelerine imkân tanıyor. DeepMind araştırmacısı Jack Parker-Holder, bu tür dünya modellerinin bedensel robotlar için kritik bir adım olduğunu vurguluyor.

Gelişmiş Simülasyonlar ve Gelecek Potansiyeli

Genie 3 hâlâ araştırma aşamasında ve henüz kamuya açık değil. Ancak modelin sunduğu 720p çözünürlükteki dakikalar süren etkileşimli simülasyonlar, eğitim ortamlarını daha güvenilir hâle getiriyor. Otonom araçlardan robotik kuryelere kadar birçok sistem, gerçek dünya koşullarına çıkmadan önce güvenli ve etik davranışlarını bu simülasyonlar sayesinde test edebilecek. Bu gelişme, yapay zekâ geliştirme dünyasında sadece büyük veri setlerinin değil, simüle edilmiş gerçekçi deneyimlerin de giderek daha fazla önem kazandığını gösteriyor.