Google, kendi iddiasına göre, gerçek bir insan sesinden ayırt edilmesi güç, yeni bir yapay zkea tabanlı "text-to-speech" sistemi geliştirdi. Bu sisteme ise Tacotron 2 adını verdi.
Tacotron 2 sistemi, ortalama görüş puanlamasından (MOS) 4.53'lük bir puan almış. Bu harika bir puan zira profesyonelce kaydedilmiş bir konuşmanın aynı testten 4.58'lik bir puan alabildiğini belirtelim.
Yeni sistem, kolayca farkedilebilen bir şekilde robotik ya da sayısallaştırılmış gibi görünmüyor ve anlambilimine bağlı olarak kelimelerin doğru telaffuzunu söylüyor. Ayrıca, hafif yazım hatalarını bile eş zamanlı şekilde düzeltebiliyor.
Bizler denedik, insan sesi ile bu yeni sistem arasındaki farkı anlayamadık. Öyleyse bakalım siz anlayabilecek misiniz? Aşağıda 4 tane se kaydı var, bunlardan her biri insan ve robot tarafından seslendirildi. Bakalım hangisinin insan, hangisinin robot sesi olduğunu anlayabilecek misiniz? Testin sonunda cevaplar yazıyor.
1.Hangisi insan sesi?
A:
B:
2.Hangisi insan sesi?
C:
D:
3.Hangisi insan sesi?
E:
F:
4.Hangisi insan sesi?
G:
H:
Farkı söyleyebilir misiniz?
Yanıtlar:
A - İnsan sesi
B - Tacotron 2 yapay zeka sesi
C - Tacotron 2 yapay zeka AI sesi
D - İnsan sesi
E - Tacotron 2 yapay zeka AI sesi
F - İnsan sesi
G - İnsan sesi
H - Tacotron 2 yapay zeka AI sesi