Bir grup araştırmacı gürültü, cıvıltı gibi sesleri yüksek doğrulukla görüntüye dönüştürebilen yapay zeka aracı geliştirdi.
Üretsel yapay zekanın yetenekleri ve potansiyeli yıllardır konuşuluyordu ancak OpenAI, ChatGPT’yi duyurup son kullanıcının hizmetine sunduğundan beri hiçbir şey aynı olmadı. Yapay zeka, elimizi attığımız her türlü elektronik cihazın içine girmiş durumda ki yapılan açıklamalar, önümüzdeki dönemde çok daha fazlasını göreceğimizi ortaya koyuyor.
Bugüne kadar metinden ses üreten, metinden resim üreten, metinden video üreten, sesten metin üreten vb. yapay zeka araçları görmüştük. Teksas Üniversitesi’nden bir grup araştırmacı, basit bir yapay zeka aracı geliştirerek sesten görüntü üretmeyi başardı. Nasıl çalıştığını özetlemek gerekirse; bu yapay zeka aracına bir şehir gürültüsü dinlettiğinizde bu gürültüye uyumlu bir cadde çiziyor ya da cıvıl cıvıl kuş sesleri dinlettiğinizde kuşların bulunduğu bir doğa manzarası görseli oluşturuyor.
Yapay zeka, sesi görüntüye dönüştürürken ışıklandırmayı bile göz önünde bulunduruyor
Haberin başında da söylediğimiz gibi söz konusu yapay zeka deneysel ve son derece basit. Yapay zekayı eğitmek için farklı kentsel ve kırsal bölgelerin ses ve görsellerini içeren verilerden 10’ar saniyelik klipler kullanıldı. Nihayetinde yapay zeka, mimari stil, nesneler arasındaki mesafe ve hatta ışıklandırma koşullarını dahi göz önünde bulundurduğu gerçekçi görseller oluşturabildi. Paylaşılan araştırma makalesine göre oluşturulan görsellerdeki doğruluk oran %80 seviyesindeydi.
Peki bu yapay zeka üzerine daha fazla çalışıldığını ve gelişmiş bir araç haline dönüştürüldüğünü varsayalım, ne işe yarayacak? Günümüz büyükşehirlerinde gürültünün en önemli sorunlardan biri olduğunu hepimiz biliyoruz. Bu yapay zeka aracıyla çok daha iyi bir şehir planlaması söz konusu olabilir. Ayrıca seslerin yapay zeka tarafından analiz edilmesi sonucu kriminal olaylar dahi aydınlatılabilir; güvenlik kameralarına güvenlik mikrofonları eşlik etmeye başlayabilir. Tabii bu aracın film, oyun gibi sektörlerde kullanımdan bahsetmiyoruz bile…
Kaynak :https://news.utexas.edu/2024/11/27/researchers-use-ai-to-turn-sound-recordings-into-accurate-street-images/