adv

百度软件只需 3.7 秒长的音频就能克隆任何人的声音

百度 人工智能
pigsrollaroundinthem (39396)发表于 2018年03月08日 20时53分 星期四
来自只相信当面说的话部门
百度开发的新 AI 算法只需 3.7 秒长的音频就能克隆任何人的声音。百度研究院的研究人员在预印本网站 arxiv 上的发表了其 Deep Voice 系统的最新进展《Neural Voice Cloning with a Few Samples》(PDF)。除了利用少量样本克隆声音外,系统还能将女性声音转变成男性,英式声音变成美式。百度研究人员表示,这项研究可应用于人机交互的个性化方面。