0. 效果演示

演示音频分割功能可以访问 https://www.bilibili.com/video/BV1oxrcYuELK
演示视频分割功能可以访问 https://www.bilibili.com/video/BV1xYweeKEvZ

1. 说明

这是基于开源的 FunASR 实现的说话人分离的 GUI 项目，可以在支持图形界面中的任意 PC 端运行
要求 python version >= 3.8
支持运行在 Windows、MacOS、Linux 系统
本项目适合个人电脑使用，如果要在生产服务器中部署，并且需要并发处理，可到我博客中联系我

2. 开发日志

2023-11-14 对选择的多个音频分离不同的人声
2024-01-04 保存每个说话人对应的内容
2024-01-09 增加合并相同说话人功能
2024-01-22 增加视频切片功能

3. 安装

执行下面命令来安装依赖

pip install -U funasr modelscope ffmpeg-python pydub

此外还需要安装 torch，可以到 torch 官方中根据自己电脑情况安装不同版本的 torch
安装 ffmpeg，可以到 github 中搜索 ffmpeg，下载解压后，配置环境变量

4. 功能

支持对指定的单个或者多个音频中不同的说话人讲的话进行分离，分别归类到不同的目录中
保存每个说话人对应的内容
如果你需要对视频进行切片，需要修改源代码，欢迎有能力的大佬提交 Pr

5. 模型下载

执行下面程序，会自动下载模型到当前用户 .cache/modelscope/hub/iic/ 目录中

python download_model.py

6. 联系

可以添加交流群 746213237
个人技术分享博客：https://blog.lukeewin.top
如果是小白，不懂代码，可以点击这里

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
img		img
top/lukeewin		top/lukeewin
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

0. 效果演示

1. 说明

2. 开发日志

3. 安装

4. 功能

5. 模型下载

6. 联系

About

Releases

Packages

Languages

lukeewin/AudioSeparationGUI

Folders and files

Latest commit

History

Repository files navigation

0. 效果演示

1. 说明

2. 开发日志

3. 安装

4. 功能

5. 模型下载

6. 联系

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages