Skip to content

Quick Start (Newbie)

Vega edited this page Oct 26, 2021 · 7 revisions

快速开始 (新手友好版)

本快速开始教程是以Windows为例的,假设不做任何训练(节省几小时甚至几天时间),假设你对python等开发环境也不熟悉,也可能没有支持CUDA的GPU

安装

如果已经确认安装过,请忽略该步骤

  • 拉取本代码库

  • 安装Anacodna, Python 3.8 或更高,参考中文教程,在Anaconda中创建并切换到独立虚拟环境后,进行以下步骤。

  • 安装 PyTorch, 直接官网下载。如果GPU不支持CUDA,请默认选择。

验证本步骤是否成功:在系统任意路径下运行python,进入交互式编程界面后输入 import torch;, 回车, torch.cuda.is_available(), 回车。如果都是成功的话,可以进行下一步。

torch1

  • 安装 ffmpeg。 1)下载 选择点击打开链接Windows对应的版本下载 2)解压 ffmpeg-xxxx.zip 文件到指定目录; 3)将解压后的文件目录中 bin 目录(包含 ffmpeg.exe )添加进 path 环境变量中; 4)进入 cmd,输入 ffmpeg -version,可验证当前系统是否识别 ffmpeg 以及查看 ffmpeg 的版本

  • 运行pip install -r requirements.txt 来安装剩余的必要包。

确保本步骤不报错

  • 安装 webrtcvad 用 pip install webrtcvad-wheels。

确保本步骤不报错

下载社区训练好的模型

在以下选择中下载模型

作者 下载链接 效果预览
@miven https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ 提取码:2021 https://www.bilibili.com/video/BV1uh411B7AD/

该模型与最新代码有兼容性问题 请查阅 https://github.com/babysor/MockingBird/issues/37 解决

下载完成后,确保 xxx.pt 格式的文件放在代码库的 synthesizer\saved_models文件夹下,saved_models如不存在请新建

运行demo_toolbox

在代码库路径下,运行 python demo_toolbox.py -d .\samples 尝试使用工具箱, 由于没有下载任何数据集,这里的功能比较简单:

  1. 确保界面左边中间的 synthesizer 选择了上一步中 xxx.pt 文件对应的模型。
  2. 点击Record录入你的5秒语音
  3. 输入任意文字
  4. 点击 Synthesizer and vocode 等待效果输出

tool1

使用技巧参考:https://zhuanlan.zhihu.com/p/425692267

遇到任何报错可以在issue中搜索

Clone this wiki locally