streaming-sensevoice

Streaming SenseVoice processes inference in chunks of SenseVoice.

Usage

transcribe wav file

$ python main.py

transcribe from microphone

$ python realtime.py

transcribe from websocket

A basic WebSocket service built with Recorder and FastAPI; the frontend uses MP3 format to transmit audio information to reduce latency and increase stability.

pip install -r requirements-ws-demo.txt
python realtime_ws_server_demo.py

# check cli options
python realtime_ws_server_demo.py --help

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
data		data
images		images
streaming_sensevoice		streaming_sensevoice
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
main.py		main.py
realtime.py		realtime.py
realtime_ws_client.html		realtime_ws_client.html
realtime_ws_server_demo.py		realtime_ws_server_demo.py
requirements-ws-demo.txt		requirements-ws-demo.txt
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

streaming-sensevoice

Usage

About

Releases

Packages

Contributors 2

Languages

License

pengzhendong/streaming-sensevoice

Folders and files

Latest commit

History

Repository files navigation

streaming-sensevoice

Usage

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages