Çinli teknoloji devi Baidu tüm aksanları metinden sese dönüştürüyor

Sinir ağı eğitiminin sese dönüştürülmesi 30 dakikanın altına düştü

Çin’in teknoloji devi Baidu’nun metinleri sese dönüştüren yeni sistemi Deep Voice, kulağa insan sesinden daha orjinal gelen ses oluşturma yolunda ilerliyor. Bu teknoloji ile ilgili gelen son bilgiler arasında bu cihazın çok ilginç bir özelliği olduğu var. O da, farklı bölgelerin aksanlarını farklılıklarını gözeterek seslendirebilmesi. Bunu yaparken de doğru bir biçimde ve insanı yormayan bir tını ile bu işi yapabilmesi. Bu sistem aslında dünyada çok yeni değil ancak 30 dakikanın altında dönüştürebileni henüz yalnız Deep Voice.

Deep Voice 2

Çinli şirket, devamı niteliğinde geliştirdiği yeni sürüm olan Deep Voice 2’nin özelliklei hakkında: “Ses başına yarım saatten çok daha az bir süre içerisinde yüzlerce ses kaydı içinden eşsiz dil kazanımları elde edebiliyor” diyor. Google’ın WaveNet’inin benzer sonuçlar elde etmesi beklenen 20 saatlik eğitim saatiyle karşılaştırıldığında alınan verim kat kat fazlası alındı.

baidu ile ilgili görsel sonucu

Baidu, daha önceki metne dayalı konuşma sistemlerinden farklı olarak Deep Voice 2’nin tek başına ve herhangi bir rehber olmadan çalıştığını söylüyor. Bir blog Deep Voice 2 hakkında, “Deep Voice 2, yüzlerce sesi kolaylıkla öğrenebilir, onları mükemmel bir biçimde taklit edebilir” diyor.

OKU ►  Samsung, Gear Smartwatch'lar için iPhone uygulamasını duyurdu

Baidu, bir araştırma makalesinde yüzlerce farklı konuşmacının ses örneklerinden etkili bir biçimde ses ağları üretebileceğinden söz ediyor. Günden güne gelişen teknoloji sayesinde hem akademik hem uygulama alanlarında Deep Voice kendini geliştiriyor.

CEVAP VER

Please enter your comment!
Please enter your name here