e
sv

OpenAI Kodda Hata Yakalayan Yeni Yapay Zeka Modeli CriticGPT’yi Duyurdu

28 Haziran 2024 17:24
OpenAI Kodda Hata Yakalayan Yeni Bir Yapay Zeka Modeli CriticGPT'yi Duyurdu

OpenAI araştırmacıları, ChatGPT tarafından üretilen kodlardaki hataları tespit etmek için tasarlanmış yeni bir yapay zeka modeli olan CriticGPT’yi duyurdu. Bu model, büyük dil modellerinin (LLM’ler) çıktılarını daha doğru hale getirmek için insan geri bildiriminden pekiştirmeli öğrenme (RLHF) sürecini geliştirmeyi amaçlıyor.

CriticGPT Nasıl Çalışıyor?

CriticGPT, GPT-4 ailesi LLM’lerine dayalı olarak geliştirildi. Model, ChatGPT yapay zeka asistanı tarafından oluşturulan programlama kodunu analiz ediyor ve olası hataları işaret ediyor. Bu sayede insan eğitmenlerinin gözden kaçabilecek hataları daha kolay fark etmelerini sağlıyor. Araştırmacılar, CriticGPT’yi bilinçli olarak hata eklenen kod örnekleri veri setinde eğiterek çeşitli kodlama hatalarını tanımayı ve işaretlemeyi öğretti.

OpenAI Kodda Hata Yakalayan Yeni Bir Yapay Zeka Modeli CriticGPT'yi Duyurdu

CriticGPT’nin Başarısı İnsan Eleştirilerini Geride Bıraktı

Araştırmacılar, CriticGPT’nin eleştirilerinin, doğal olarak oluşan LLM hatalarının yüzde 63’ünde insan eleştirilerine tercih edildiğini keşfetti. CriticGPT kullanan insan-makine ekiplerinin, yalnızca insanlardan daha kapsamlı eleştiriler yazdığını ve yapay zeka tarafından üretilen eleştirilere kıyasla uydurma (halüsinasyon) oranlarını azalttığını gördüler.

CriticGPT’nin Potansiyeli Sadece Kodla Sınırlı Değil

Araştırmacılar, CriticGPT’nin yeteneklerinin sadece kod incelemeyle sınırlı olmadığını fark etti. Daha önce insan değerlendiriciler tarafından kusursuz olarak derecelendirilen ChatGPT eğitim verilerinin bir alt kümesine modeli uyguladıklarında, CriticGPT bu durumlarda yüzde 24 oranında hata tespit etti ve bu hatalar daha sonra insan değerlendiriciler tarafından doğrulandı. OpenAI, bunun modelin kod dışı görevlere genelleştirme potansiyelini gösterdiğini ve dikkatli insan değerlendirmesinin bile gözden kaçırabileceği ince hataları yakalama yeteneğini vurguladığını düşünüyor.

OpenAI Kodda Hata Yakalayan Yeni Bir Yapay Zeka Modeli CriticGPT'yi Duyurdu

CriticGPT’nin Sınırlamaları ve Gelecek Planları

Tüm yapay zeka modelleri gibi CriticGPT’nin de bazı sınırlamaları var. Model nispeten kısa ChatGPT cevaplarında eğitildiği için gelecekteki yapay zeka sistemlerinin ele alabileceği daha uzun ve karmaşık görevleri değerlendirmeye tam olarak hazır olmayabilir. Ek olarak, CriticGPT uydurmaları azaltsa da tamamen ortadan kaldırmıyor ve insan eğitmenler hala bu yanlış çıktılara dayalı olarak etiketleme hataları yapabiliyor.

RLHF Etiketleme Süreci Başlıyor

OpenAI, CriticGPT benzeri modelleri RLHF etiketleme sürecine entegre etmeyi planlıyor. Bu, eğitmenlere yapay zeka desteği sağlayacak. Ancak araştırmacılar, CriticGPT gibi araçlarla bile, son derece karmaşık görevlerin veya yanıtların, ek destek olmadan insanlar tarafından değerlendirilmesinin zor olabileceği konusunda uyarıyor.

  • Site İçi Yorumlar

En az 10 karakter gerekli

Gönderdiğiniz yorum moderasyon ekibi tarafından incelendikten sonra yayınlanacaktır.