GPT-SoVITS-WebUI, 超强声音创作的AI应用详细教程.

李白

发布时间:

https://bingzhuyeyou.com/

 

1 GPT-SoVITS-WebUI简介

  1. GPT-SoVITS是一个开源的声音克隆项目,该语音合成工具结合了GPT (Generative Pre-trained Transformer)模型和SoVITS(Speech-to-Video Voice Transformation System)变声器技术,仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换(TTS)。
  2. 该工具特别适用于需要快速生成特定人声的场景,可以帮助用户在没有或只有少量目标说话人语音样本的情况下,训练出能够模仿该说话人声音(包括情感、音色、语速)的模型。
  3. 和stable diffusion webui一样, GPT-SoVITS-WebUI也具有可视化的web界面,方便普通用户使用。

2 原始声音/合成声音对比

  • 卡莎
  • 三体

链接:https://pan.baidu.com/s/1abzoWCe0B0e6CDINmMzUuQ?pwd=bzyy
提取码:bzyy

3 GPT-SoVITS-WebUI安装

  1. 在 Mac 上使用 GPU 训练的模型效果显著低于其他设备训练的模型,所以作者不建议使用CPU进行训练。
  2. 这里介绍windows系统最简单方便的方式,直接百度云下载打包好的文件即可。
此隐藏内容仅限VIP查看升级VIP

 

 

5 文章目录

https://bingzhuyeyou.com/

发表评论

没有账号? 忘记密码?