1 GPT-SoVITS-WebUI简介
- GPT-SoVITS是一个开源的声音克隆项目,该语音合成工具结合了GPT (Generative Pre-trained Transformer)模型和SoVITS(Speech-to-Video Voice Transformation System)变声器技术,仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换(TTS)。
- 该工具特别适用于需要快速生成特定人声的场景,可以帮助用户在没有或只有少量目标说话人语音样本的情况下,训练出能够模仿该说话人声音(包括情感、音色、语速)的模型。
- 和stable diffusion webui一样, GPT-SoVITS-WebUI也具有可视化的web界面,方便普通用户使用。
2 原始声音/合成声音对比
- 卡莎
- 三体
链接:https://pan.baidu.com/s/1abzoWCe0B0e6CDINmMzUuQ?pwd=bzyy
提取码:bzyy
3 GPT-SoVITS-WebUI安装
- 在 Mac 上使用 GPU 训练的模型效果显著低于其他设备训练的模型,所以作者不建议使用CPU进行训练。
- 这里介绍windows系统最简单方便的方式,直接百度云下载打包好的文件即可。
此隐藏内容仅限VIP查看升级VIP