Veri tabanının amacı, yapay zekâ dil modellerinin eğitimi için “hassas içeriklerin” filtrelenmesini amaçlıyordu. 133 binden fazla örnek hassas içeriğin bulunduğu veri tabanında Çin’deki kırsal kesimlerdeki yoksulluklar, hükûmetle ilgili yolsuzluklar ve polislerin rüşvet alması gibi meseleler vardı. Çoğu siyasetle ilgili olan girdiler arasında askerler ve Tayvan ile ilgili veriler de bulunuyordu. Kaynaklar, buradaki temel hususun Çin hükûmetinin hoşlanmadığı şeyler olduğunu ifade ediyorlar.
NetAskari isimli bir siber güvenlik şirketi, Çin hükûmeti ile ilgili skandal bir keşif yaptı. Uzmanlar, Çin hükûmetinin yapay zekâ modellerini sansürlemek için devasa bir veri tabanına sahip olduğunu tespit ettiler. Üstelik bu veri tabanı, yüksek güvenlik tedbirleriyle de korunmamıştı.
Çin’in yapay zekâ modellerini eğitmek için devasa bir veri tabanı oluşturduğu tespit edildi. Ancak bu veri tabanı, modelin hassas içeriklere karşı filtrelenmesine yardımcı oluyordu. Veri tabanının içeriği ise oldukça dikkat çekici.
Nerede, kimin kullandığı belli değil

Veri tabanının kim veya kimler tarafından ne için kullanıldığı belli değil. Kaynaklar, Çin hükûmetinin yeni bir yapay zekâ dil modeli üzerinde çalışıyor olabileceğini söylüyorlar. Öte yandan; bu yapay zekâ modeli ülkedeki muhalif isimlerin tespit edilmesini amaçlıyor da olabilir. Ancak bu veri tabanının eski olmadığını özellikle belirtelim. Zira yakın zamanda oluşturulan veri tabanı, Aralık 2024 itibarıyla hareketsiz.
Ortaya çıkan veri tabanı, Çinli yetkilileri de harekete geçirdi. Çin’in Washington Büyükelçiliği tarafından yapılan açıklamada Çin’in yapay zekâya büyük önem verdiğine vurgu yapıldı. Yetkililer, söz konusu olayın asılsız iddialara ve iftiralara dayandığını söylediler. Bakalım bu veri tabanı, ilerleyen dönemlerde ne gibi olaylarla ilişkilendirilecek.
Kaynak :https://techcrunch.com/2025/03/26/leaked-data-exposes-a-chinese-ai-censorship-machine/