,10月24日,趣丸科技宣布与香港中文大学联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源,面向全球用户开放使用。区别于传统TTS模型,该模型采用掩码生成模型与语音表征解耦编码的技术范式,在声音克隆、跨语种合成、语音控制等任务中性能表现突出。据介绍,MaskGCT在三个TTS基准数据集上都达到了SOTA效果。
趣丸科技开源语音大模型MaskGCT
2024-10-25 10:34 来源:星元科技
,10月24日,趣丸科技宣布与香港中文大学联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源,面向全球用户开放使用。区别于传统TTS模型,该模型采用掩码生成模型与语音表征解耦编码的技术范式,在声音克隆、跨语种合成、语音控制等任务中性能表现突出。据介绍,MaskGCT在三个TTS基准数据集上都达到了SOTA效果。