Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[feature] 支持任意外部程序提供识别结果 #6

Open
am009 opened this issue Jul 4, 2023 · 6 comments
Open

[feature] 支持任意外部程序提供识别结果 #6

am009 opened this issue Jul 4, 2023 · 6 comments

Comments

@am009
Copy link
Collaborator

am009 commented Jul 4, 2023

支持调用外部脚本提供识别结果,比如python脚本。音频捕获和识别由外部脚本负责。
这一块还没想好输入格式怎么定义,目前考虑输入格式由'\r' '\n'控制刷新行和一句话结束。可能可以用自定义正则匹配结果?

如果你觉得这个功能很有用,在下面点击👍吧。
如果你有什么想法可以在下面评论。

@csukuangfj
Copy link

借楼提个建议。

Screenshot 2023-07-04 at 13 47 13

上面的 zip 文件,应该是包含了模型文件,导致文件有点大。

是否可以提供模型下载的功能?同时,可以提供多个模型供用户下载,这样就可以不把模型打包到 exe 里面,可以显著减少 exe 的大小。

@am009
Copy link
Collaborator Author

am009 commented Jul 4, 2023

目前因为担心用户没有安装.net framework,所以把运行时也打包了,导致没有模型体积也很大。

之后看看怎么支持模型下载的功能。有点担心如果把下载链接设置为github或者huggingface,国内下载会有网络问题。

@csukuangfj
Copy link

国内下载会有网络问题

可以考虑阿里的 https://modelscope.cn/home

可以把模型存 modelscope, 然后获取下载链接,就可以下载了。
(可以把它当做一个网盘使用)

下载链接的话,可以提供多个,挨个试,成功了,就停止试下一个

@whw23
Copy link

whw23 commented Oct 22, 2024

能否考虑接入Windows自带的语音识别 https://learn.microsoft.com/en-us/windows/apps/design/input/speech-recognition

@am009
Copy link
Collaborator Author

am009 commented Oct 22, 2024

这个确实很不错

能否考虑接入Windows自带的语音识别 https://learn.microsoft.com/en-us/windows/apps/design/input/speech-recognition

@wt666666
Copy link

SenseVoice流式支持 可否能用上?
https://github.com/pengzhendong/streaming-sensevoice/

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants