多媒体类 VALL-E X-轻便快速且强大的AI声音克隆 VALL-E X是一个开源的多语言文本到语音合成与语音克隆模型。该模型支持多种语言(英语、中文和日语)和零样本语音克隆,你只需要提供一个人短短几秒钟的录音(3-10秒),就能模仿出那个人的声音。此外,... 10月13日 热度16 ℃ 发表评论 阅读全文