OpenAI, Yeni Ses Modellerini Tanıttı: Artık Arka Plan Gürültüsü Vız Gelir, Tırıs Gider!

21 Mart 2025 21 Mart 2025 tarihinde düzenlendi 174 kez okundu Okuma süresi: 1dk, 41sn

OpenAI, Yeni Ses Modellerini Tanıttı: Artık Arka Plan Gürültüsü Vız Gelir, Tırıs Gider!

OpenAI, sesli konuşma ve metinden sese çeviri konusunda yepyeni modellerini tanıttı. Peki, bu modeller neler sunuyor? İşte tüm detaylar!

OpenAI, sesli konuşma ve metinden sese çeviri konusunda yeni modellerini duyurdu. Artık API üzerinden erişilebilen bu modeller, konuşmaları daha doğal hale getirirken metinleri de daha doğru şekilde sese dönüştürebiliyor. Kısacası yapay zekâ artık sadece konuşmakla kalmıyor, nasıl konuşacağını da çok daha iyi kavrıyor!

OpenAI, metinden sese çeviri ve konuşmadan metne çeviri yapan yeni yapay zekâ modellerini tanıttı. Modeller, daha doğal sesler sunuyor.

OpenAI yeni modellerini duyurdu

OpenAI ses modelleri

Yeni modeller arasında yer alan “gpt-4o-mini-tts”, metinden sese çeviri yaparak daha doğal ve gerçekçi konuşmalar oluşturabiliyor. OpenAI, geliştiricilerin bu modelin konuşma tarzını belirleyerek farklı seslendirme seçenekleri oluşturabileceğini paylaştı. Örneğin, modelin bir bilim insanı gibi konuşması veya sakin bir rehber tonunda seslendirme yapması sağlanabiliyor. Şirket, modelin çeşitli ses tonlarını desteklediğini ve bu özelliğin kullanıcı deneyimine daha fazla esneklik kazandırdığını belirtti.

Konuşmadan metne çeviri yapan “gpt-4o-transcribe” ve “gpt-4o-mini-transcribe” modellerinin, OpenAI’nin eski Whisper modelinin yerini aldığı açıklandı. Şirket, yeni modellerin daha geniş kapsamlı ve kaliteli ses verileriyle eğitildiğini paylaştı. Bu sayede farklı aksanları ve konuşma biçimlerini daha iyi algılayabildiğini belirten OpenAI, modellerin yoğun arka plan gürültüsüne sahip ortamlarda bile konuşmaları daha doğru şekilde çözümlenebildiğini ifade etti.

Ancak OpenAI, yeni transkripsiyon modellerini açık kaynak olarak sunmayacağını duyurdu. Daha önce Whisper modelini açık kaynak olarak paylaşan şirket, yeni modellerin çok daha büyük olduğunu ve yerel cihazlarda çalıştırılmasının zor olacağını ifade etti. OpenAI, ilerleyen dönemde cihazlara özel daha hafif versiyonların açık kaynak olarak yayımlanmasının değerlendirilebileceğini belirtti.

Kaynak :https://openai.com/index/introducing-our-next-generation-audio-models/

Post Views: 174

İlgili

Bu Yazıya Tepkiniz Ne Oldu?

0

Beğendim
0

Alkışlıyorum
0

Eğlendim
0

Düşünceliyim
0

İğrendim
0

Üzüldüm
0

Çok Kızdım

EtiketlerYapay Zeka

Adnan Güney

Adnan Güney; Bilim, Teknoloji, Mobil, Medya,Yapay zeka, Uzay Sosyal medya, yararlı konularda güncel açıklama ve uygulamaların anlatıldığı bir web sitesidir.

Yazarın Profili

OpenAI, Yeni Ses Modellerini Tanıttı: Artık Arka Plan Gürültüsü Vız Gelir, Tırıs Gider!

OpenAI yeni modellerini duyurdu

İlgili

Yorum Yap İptal

Ekonomi Yazıları

Tüm Duyurular ve Paylaşılan Fragmanlar Future Games Show 2025

Deniz Savaşları Getirecek Yeni DLC War Sails Duyuruldu: Mountain & Blade II: şte Fragmanı [Video]

Dış Paneli Düşme Riski Taşıyor! 46.000 Cybertruck Bir Kez Daha Geri Çağrılıyor: