[feature] 支持任意外部程序提供识别结果 #6

am009 · 2023-07-04T05:32:05Z

支持调用外部脚本提供识别结果，比如python脚本。音频捕获和识别由外部脚本负责。
这一块还没想好输入格式怎么定义，目前考虑输入格式由'\r' '\n'控制刷新行和一句话结束。可能可以用自定义正则匹配结果？

如果你觉得这个功能很有用，在下面点击👍吧。
如果你有什么想法可以在下面评论。

csukuangfj · 2023-07-04T05:49:06Z

借楼提个建议。

上面的 zip 文件，应该是包含了模型文件，导致文件有点大。

是否可以提供模型下载的功能？同时，可以提供多个模型供用户下载，这样就可以不把模型打包到 exe 里面，可以显著减少 exe 的大小。

am009 · 2023-07-04T07:06:32Z

目前因为担心用户没有安装.net framework，所以把运行时也打包了，导致没有模型体积也很大。

之后看看怎么支持模型下载的功能。有点担心如果把下载链接设置为github或者huggingface，国内下载会有网络问题。

csukuangfj · 2023-07-04T07:10:21Z

国内下载会有网络问题

可以把模型存 modelscope, 然后获取下载链接，就可以下载了。
（可以把它当做一个网盘使用）

下载链接的话，可以提供多个，挨个试，成功了，就停止试下一个

whw23 · 2024-10-22T09:34:20Z

am009 · 2024-10-22T09:37:16Z

这个确实很不错

能否考虑接入Windows自带的语音识别 https://learn.microsoft.com/en-us/windows/apps/design/input/speech-recognition

wt666666 · 2024-11-12T15:13:40Z

Provide feedback