Skip to content

商用级开源语音自动识别程序库,开箱即用,全平台支持,中英文混合识别。A Cross-platform implementation of ASR inference. It's based on ONNXRuntime and FunASR. We provide a set of easier APIs to call ASR models.

License

Notifications You must be signed in to change notification settings

standyyyy/RapidASR

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Rapid ASR

  • 🎉 推出知识星球RapidAI私享群,这里的提问会优先得到回答和支持,也会享受到RapidAI组织后续持续优质的服务。欢迎大家的加入。
  • Paraformer模型出自阿里达摩院Paraformer语音识别-中文-通用-16k-离线-large-pytorch
  • 本仓库仅对模型做了转换,只采用ONNXRuntime推理引擎。该项目核心代码已经并入FunASR
  • 项目仍会持续更新,欢迎关注。

📖文档导航

📆TODO以及任务认领

  • 参见这里:link

🎨整体框架

flowchart LR

A([wav]) --RapidVad--> B([各个小段的音频]) --RapidASR--> C([识别的文本内容]) --RapidPunc--> D([最终识别内容])
Loading

📣更新日志

详情
  • 2023-02-25
    • 添加C++版本推理,使用onnxruntime引擎,预/后处理代码来自: FastASR
  • 2023-02-14 v2.0.3 update:
    • 修复librosa读取wav文件错误
    • 修复fbank与torch下fbank提取结果不一致bug
  • 2023-02-11 v2.0.2 update:
    • 模型和推理代码解耦(rapid_paraformerresources
    • 支持批量推理(通过resources/config.yamlbatch_size指定)
    • 增加多种输入方式(Union[str, np.ndarray, List[str]]
  • 2023-02-10 v2.0.1 update:
    • 添加对输入音频为噪音或者静音的文件推理结果捕捉。

About

商用级开源语音自动识别程序库,开箱即用,全平台支持,中英文混合识别。A Cross-platform implementation of ASR inference. It's based on ONNXRuntime and FunASR. We provide a set of easier APIs to call ASR models.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • C++ 68.3%
  • Python 16.8%
  • C 14.5%
  • CMake 0.4%