超过15秒的录音分离误差很大 #49

yhbsdtc · 2025-01-13T03:06:18Z

能否优化代码，目前测试15秒以内的录音分离基本0误差，能否实现将所有需要处理的音频导入以后，先切割成多个15秒的文件，逐个分离，然后再合并

lukeewin · 2025-01-14T06:46:39Z

能否优化代码，目前测试15秒以内的录音分离基本0误差，能否实现将所有需要处理的音频导入以后，先切割成多个15秒的文件，逐个分离，然后再合并

这个很好实现，你自己用python实现就行了

alibabasglab · 2025-01-21T02:37:44Z

代码里面有相关配置：https://github.com/modelscope/ClearerVoice-Studio/blob/main/clearvoice/config/inference/MossFormer2_SS_16K.yaml ，修改‘decode_window: 30’，可以改成‘decode_window: 15’ ，这里15代表每次处理15秒的语音段。

gaoyiyeah · 2025-01-21T09:08:26Z

代码里面有相关配置：https://github.com/modelscope/ClearerVoice-Studio/blob/main/clearvoice/config/inference/MossFormer2_SS_16K.yaml ，修改‘decode_window: 30’，可以改成‘decode_window: 15’ ，这里15代表每次处理15秒的语音段。

这样的话，怎么解决permutation问题

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

超过15秒的录音分离误差很大 #49

超过15秒的录音分离误差很大 #49

yhbsdtc commented Jan 13, 2025

lukeewin commented Jan 14, 2025

alibabasglab commented Jan 21, 2025

gaoyiyeah commented Jan 21, 2025

超过15秒的录音分离误差很大 #49

超过15秒的录音分离误差很大 #49

Comments

yhbsdtc commented Jan 13, 2025

lukeewin commented Jan 14, 2025

alibabasglab commented Jan 21, 2025

gaoyiyeah commented Jan 21, 2025