1. Anasayfa
  2. Yapay zeka

Resmen Ters Köşe Oldu! Gemini’ı Kendi Silahıyla Vurdular:

Resmen Ters Köşe Oldu! Gemini’ı Kendi Silahıyla Vurdular:
0

Normalde işe yaramayan komut hileleri, bu yöntemle bir anda etkili hale geliyor. Yöntemin adı ise oldukça eğlenceli: “Fun-Tuning”. Bu yaratıcı yaklaşım, ABD’deki UC San Diego ve Wisconsin Üniversitesi’nden araştırmacılar tarafından geliştirilmiş.

Araştırmacılar, Google’ın yapay zekâ modeli Gemini’yı kandırmanın ilginç bir yolunu keşfetti. Üstelik bunu yaparken Gemini’nin kendi “ince ayar” özelliğini kullandılar. Yani yapay zekâya, adeta kendi silahıyla tuzak kurdular.

Gemini’ye yönelik saldırılarda modelin kendi eğitim sürecindeki geri bildirim mekanizmasından faydalanıldığı ortaya kondu.

Yapay zekâ kendi verdiği geri bildirimlerle kandırıldı

gemini saldırı

Yöntemde, etkisiz kalan komut enjeksiyonlarının başına ve sonuna rastgele ifadeler eklenerek saldırılar güçlendirildi. Araştırmacılar, “wandel ! ! ! !” ya da “formatted ! ASAP !” gibi ifadelerle çevrelenen saldırı metinlerinin Gemini’nin yanıtlarını manipüle edebildiğini ortaya koydu.

Araştırma ekibi, geliştirdikleri yöntemin Gemini 1.5 Flash modelinde %65, Gemini 1.0 Pro modelinde ise %82 oranında başarı sağladığını paylaştı. Aynı saldırıların farklı Gemini modellerinde de benzer şekilde işe yaradığına dikkat çekti. Bu başarıda, modelin eğitim sürecinde verdiği geri bildirimlerin doğrudan kullanılması etkili oldu.

Google, söz konusu yöntemle ilgili doğrudan bir açıklama yapmadı. Şirket, yaptığı genel açıklamada bu tür saldırılara karşı savunma mekanizmaları geliştirmenin öncelikli konular arasında yer aldığını ifade etti. Araştırmacılar ise bu sorunun kolay çözülemeyeceğini dile getirdi. Çünkü saldırının temelinde, Gemini’ın ince ayar özelliğiyle çalışan ve özelleştirilebilirliğini sağlayan yapının yer aldığına dikkat çekti.

Kaynak :https://www.androidauthority.com/gemini-hack-gemini-3539624/

Bu Yazıya Tepkiniz Ne Oldu?
  • 0
    be_endim
    Beğendim
  • 0
    alk_l_yorum
    Alkışlıyorum
  • 0
    e_lendim
    Eğlendim
  • 0
    d_nceliyim
    Düşünceliyim
  • 0
    _rendim
    İğrendim
  • 0
    _z_ld_m
    Üzüldüm
  • 0
    _ok_k_zd_m
    Çok Kızdım

Adnan Güney; Bilim, Teknoloji, Mobil, Medya,Yapay zeka, Uzay Sosyal medya, yararlı konularda güncel açıklama ve uygulamaların anlatıldığı bir web sitesidir.

Yazarın Profili

Bültenimize Katılın

Hemen ücretsiz üye olun ve yeni güncellemelerden haberdar olan ilk kişi olun.

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir