- 🎉 推出知识星球RapidAI私享群,这里的提问会优先得到回答和支持,也会享受到RapidAI组织后续持续优质的服务。欢迎大家的加入。
- Paraformer模型出自阿里达摩院Paraformer语音识别-中文-通用-16k-离线-large-pytorch。
- 本仓库仅对模型做了转换,只采用ONNXRuntime推理引擎。该项目核心代码已经并入FunASR。
- 项目仍会持续更新,欢迎关注。
- 语音识别:
- rapid_paraformer:
- rapid_wenet
- rapid_paddlespeech-Python
- 标点符号
- 参见这里:link
flowchart LR
A([wav]) --RapidVad--> B([各个小段的音频]) --RapidASR--> C([识别的文本内容]) --RapidPunc--> D([最终识别内容])
详情
- 2023-02-25
- 添加C++版本推理,使用onnxruntime引擎,预/后处理代码来自: FastASR
- 2023-02-14 v2.0.3 update:
- 修复librosa读取wav文件错误
- 修复fbank与torch下fbank提取结果不一致bug
- 2023-02-11 v2.0.2 update:
- 模型和推理代码解耦(
rapid_paraformer
和resources
) - 支持批量推理(通过
resources/config.yaml
中batch_size
指定) - 增加多种输入方式(
Union[str, np.ndarray, List[str]]
)
- 模型和推理代码解耦(
- 2023-02-10 v2.0.1 update:
- 添加对输入音频为噪音或者静音的文件推理结果捕捉。