我在一台realme手机上运行了这个项目!
如果是ubuntu上进行推理的话,你也可以看这里
这个项目的意义在于,如果你是一个应用者,可以完全舍弃源项目! 不需要复杂的环境搭建,不需要下载特别庞大的整合包,只需要这个几M的小项目,把训练好的模型用起来即可。 我在一台手机上尝试完成的服务器的部署,这个最能说明问题。
下面的废话基本没有必要看
GPT-SoVITS项目是一个目前为止最优秀的语音克隆项目。 很多朋友使用云端的模型训练工具完成声音克隆的模型训练,推理合成的时候,其实不需要把完整的项目都克隆到本地,其实只需要从云端下载好模型文件,然后丢在本地或者服务器上即可。 训练模型对于算力要求很高,但是推理合成其实可以用CPU也行——绝大多数的服务器其实都是CPU计算,GPU服务器太贵了。
自身也懒得在很复杂的文件体系中做配置,索性从源项目提取出来了这个项目,核心内容在server.py
里面,大家可以修改里面的配置,然后使用即可。
这个版本删除了日语和英语,纯粹的中文。
pretrained_models下载地址:https://huggingface.co/lj1995/GPT-SoVITS/tree/main
把:chinese-hubert-base
,chinese-roberta-wwm-ext-large
下载后丢到本地,记得修改server.py里面的路径即可。
- 我在本地使用的是源项目提供的windows的runtime运行时环境,所以已经装好了依赖,如果有使用相同环境的,直接使用
../runtime/python.exe ./server.py
即可。 - 切记下载ffmpeg.exe放在server.py同级目录;本项目已包含,linux下不需要,删除该文件即可
- server.py里面clean_path函数一定要看注释,修改一下;
看文章开始的提示,直接看这里
- 代码的结构重新规整
- 把原来项目中的日语、英语部分重新融合进来
- 代码规范化实现
- 对Windows和Linux的兼容性代码做优化
- 优化代码的运行速度
- 把Windows部分的运行时完整提取出来,后期可以考虑用GUI进行一下封装
- 封装一个docker
做好Windows的GUI和云服务器的部署之后,大家可以在云端训练模型,完了用CPU在云端或者本地电脑进行推理,而不需要再去仔细琢磨完整的项目,对新手或者是应用型选手更加友好便捷。