Yapay Zeka

Araştırma: OpenAI modellerini telifli verilerle eğitiyor

AI Disclosures Project tarafından yapılan yeni bir araştırma, OpenAI’nin büyük dil modellerini telif hakkı korunan verilerle eğitmiş olabileceğini ortaya koydu. Çalışma, GPT-4o modelinin O’Reilly Media kitaplarındaki ücretli içerikleri tanıma yeteneği olduğunu gösteriyor.

Ücretli içerikler tanınıyor

Araştırmada, GPT-4o modelinin ücretli O’Reilly kitap içeriklerini %82 doğrulukla tanıdığı tespit edildi. Buna karşılık, OpenAI’nin eski modeli GPT-3.5 Turbo’da bu oran %50 civarında kaldı. GPT-4o’nun halka açık olmayan içerikleri, halka açık olanlara göre daha iyi tanıdığı da çalışmanın dikkat çeken bulguları arasında.

LibGen veritabanı bağlantısı

Araştırmacılar, test edilen tüm O’Reilly kitaplarının LibGen veritabanında bulunması nedeniyle, veri erişim ihlallerinin buradan kaynaklanmış olabileceğini belirtiyor. Çalışma, OpenAI’nin telif hakkı korunan verileri izinsiz kullanmasının daha geniş bir sistemik sorunun parçası olabileceğine işaret ediyor.

İçerik üreticileri için risk

Rapor, profesyonel içerik üreticilerinin gelir kaynaklarının azalmasıyla internetin içerik kalitesi ve çeşitliliğinin düşebileceği uyarısında bulunuyor. AI Disclosures Project, yapay zeka şirketlerinin model eğitim süreçlerinde daha fazla şeffaflık sağlaması gerektiğini vurguluyor.

Yasal düzenlemeler gündemde

Yasal düzenlemeler gündemde

AB Yapay Zeka Yasası’nın açıklama gerekliliklerinin, uygun şekilde belirlenip uygulanması halinde olumlu bir etki yaratabileceği ifade ediliyor. Raporda, içerik sahiplerinin çalışmalarının ne zaman model eğitiminde kullanıldığını bilmelerinin önemine dikkat çekiliyor.

Lisans anlaşmaları artıyor

Yapay zeka şirketlerinin veri lisans anlaşmaları yapmaya başladığı belirtilen raporda, Defined.ai gibi şirketlerin eğitim verisi satın alırken içerik sahiplerinden izin aldığı ve kişisel bilgileri çıkardığı örnek gösteriliyor.

Araştırma, 34 adet O’Reilly Media kitabı kullanılarak elde edilen bulguların, OpenAI’nin GPT-4o’yu halka açık olmayan telifli verilerle eğitmiş olma ihtimalini desteklediği sonucuna varıyor.

 

Mehmet

Recent Posts

Steam 113 Lira Olan Three Sisters’ı Ücretsiz Olarak Sunuyor!

Dijital oyun platformlarının en popülerlerinden biri olan Steam, oyunculara harika bir fırsat sunuyor. Normalde 2,99…

14 dakika ago

İnce Laptop Alınır Mı? Hafif Laptop Dezavantajları 2025

İnce ve hafif dizüstü bilgisayarlar, şık tasarımları ve taşınabilirlikleriyle göz dolduruyor. Ancak, estetik ve hafiflik…

24 dakika ago

E-Ticaret & AI kullanımı 2025

E-ticaret sektöründe müşteri hizmetleri, markaların müşteri memnuniyetini artırarak sadakat oluşturmasında kritik bir rol oynuyor. Ancak…

30 dakika ago

Unity İle Nintendo Switch 2’de Yeni Dönem Başlıyor

Oyun dünyasında devrim niteliğinde gelişmeler yaşanmaya devam ediyor. Son gelen bilgilere göre, Unity ve Nintendo…

37 dakika ago

Tinder, Sesli AI Flört Oyunu ‘Game Game’i Tanıttı

Tinder, yenilikçi flört deneyimlerine bir yenisini daha ekleyerek yapay zekâ destekli sesli tanışma oyunu Game…

1 saat ago

GTA 5 Geri Dönüyor Xbox Ve PC Game Pass’e Geliyor

Dünyanın en çok oynanan açık dünya oyunlarından biri olan GTA 5 , Xbox Game Pass…

1 saat ago