MockingBird(语音克隆)教程

项目地址:https://github.com/babysor/MockingBird

官方文档:https://github.com/babysor/MockingBird/blob/main/README-CN.md

创建python虚拟环境(Python 3.7 或更高版本):

激活

安装 PyTorch

安装 ffmpeg

FFMPEG https://www.gyan.dev/ffmpeg/builds/ffmpeg-release-essentials.zip

下载并添加到系统路径(仅限bin目录)

cd到MockingBird目录下安装剩余的必要包

安装 webrtcvad 

考虑训练您自己专属的模型或者下载社区他人训练好的模型:

这里我使用社区预先训练好的模型

https://pan.baidu.com/s/1VHSKIbxXQejtxi2at9IrpA 百度盘链接 提取码:i183

把训练好的模型放入D:\github\MockingBird-main\synthesizer\saved_models

训练声码器 (可选)

略….

启动Web程序:

python web.py 运行成功后在浏览器打开地址, 默认为 http://localhost:8080

启动工具箱:

请指定一个可用的数据集文件路径,如果有支持的数据集则会自动加载供调试,也同时会作为手动录制音频的存储目录。

文件结构(目标读者:开发者)

 

qihong lu