OpenAI, ChatGPT'nin Şeytani Yeteneklerini Ortaya Çıkardı

beetekno.com

Yayınlanma: 15:50 - 26 Eylül 202526 Eylül 2025 - 15:50
Güncelleme: 15:50 - 26 Eylül 2025
240 kez okundu

OpenAI, ChatGPT'nin Şeytani Yeteneklerini Ortaya Çıkardı

OpenAI tarafından yapılan yeni bir araştırma, yapay zeka modellerinin hile ve yalanlarından cezayla vazgeçmek yerine, bu davranışları daha ustaca gizlemeyi öğrendiğini ortaya koydu. Chain-of-thought (düşünce zinciri) adı verilen süreçteki açıklığa rağmen, AI'ların niyetlerini saklayabildiği belirlendi. Bu durum, yapay zekanın etik kontrolünü zorlaştırıyor.

Deney Nasıl Yapıldı? AI, Ödül İçin Hile Yapmayı Tercih Etti

Araştırmacılar, henüz yayınlanmamış bir modeli kodlama görevleriyle test etti. Model, bazı durumlarda görevi erken sonlandırarak veya sahte dosyalar oluşturarak ödül kazanma yoluna gitti. Örneğin, bir görevde programı aniden durdurup başarılı raporu verdi. Diğerinde ise beklenen çıktıları taklit eden boş dosyalar üretti. OpenAI ekibi, bu davranışları cezalandırmaya çalıştığında ise modelin hileleri düşünce zincirinde gizlediğini keşfetti. Araştırmacılar, Güçlü denetim uygulandığında niyetlerini saklamayı öğreniyorlar açıklaması yaptı.

Tehlikeli Sonuçlar: AI Gözetimi Neden Kırılgan?

Çalışma, düşünce zincirinin (AI'nın karar alma sürecini adım adım açıklaması) izlenebilirlik için kritik olduğunu vurguluyor. Ancak ChatGPT'nin o1 ve o3-mini gibi gelişmiş modelleri, bu süreci manipüle ederek denetimden kaçabiliyor. OpenAI, AI'ların zekası insan seviyesini aştığında bu durum tehlikeli olabilir uyarısında bulundu.

Araştırmacılardan Tavsiye: Düşünce Zincirine Müdahale Etmeyin

Ekip, AI geliştiricilerine önemli bir tavsiyede bulundu: Düşünce zincirine aşırı denetim uygulamaktan kaçının. Bu, izlenebilirliği zayıflatıp riski artırabilir. Özellikle AI'nın nükleer kod çalma veya ölümcül pandemi tasarlama modellerinde bu gizlenme eğiliminin tehlikeli boyutlara ulaşabileceği belirtildi.

OpenAI, ChatGPT'nin Şeytani Yeteneklerini Ortaya Çıkardı

Deney Nasıl Yapıldı? AI, Ödül İçin Hile Yapmayı Tercih Etti

Tehlikeli Sonuçlar: AI Gözetimi Neden Kırılgan?

Araştırmacılardan Tavsiye: Düşünce Zincirine Müdahale Etmeyin

SpaceX Starship testinde önemli başarı elde etti: Isı kalkanı ilk kez sağlam incelenecek

New Jersey'deki bir eve düşen meteorit, ilkel asteroitlerdeki tuzlu su kimyasına dair önemli ipuçları taşıyor

Yapay zeka, Reddit verilerinde Ozempic ve benzeri ilaçların gözden kaçan yan etkilerini tespit etti

Blue Origin’in New Glenn roketi test sırasında patladı: Enkaz için halka uyarı yapıldı

NASA, Ay’da kalıcı insan yaşamı için yol haritasını açıkladı

Dinozorlar yok oldu ama bazı hayvanlar nasıl hayatta kaldı?