簡易的字幕檔產生器,透過 sandrohanea/whisper.net 函式庫以使用 OpenAI 所釋出的 Whisper 自動語音辨識系統,將選擇的視訊或音訊檔案的聲音內容,轉譯成字幕檔案。
- 在應用程式介面上選擇設定選項,以及輸入的檔案。
- 將輸入的檔案,透過 FFmpeg 轉換成取樣率為 16 kHz 的 WAV 格式 的音訊檔案。
- 透過 sandrohanea/whisper.net 函式庫啟動 Whisper,以轉譯輸入的檔案。
- 將轉譯的結果,依據選擇,產生成 SubRip Text 或 WebVTT 等格式的字幕檔案。
- 刪除於 "2." 產生的音訊檔案。
- 本應用程式是基於 sandrohanea/whisper.net 函式庫進行開發,因此只支援 ggerganov/whisper.cpp 函式庫所採用的 ggml 格式 的模型檔案。
- 因 sandrohanea/whisper.net 函式庫的實作限制,可能會有部分 ggerganov/whisper.cpp 函式庫的功能不被支援。
- ggerganov/whisper.cpp
- Copyright (c) 2023 Georgi Gerganov
- MIT 授權條款
- sandrohanea/whisper.net
- Copyright (c) 2023 sandrohanea
- MIT 授權條款
- Xabe.FFmpeg
- FFmpeg
因 Xabe.FFmpeg 函式庫授權合約的限制,此 GitHub 倉庫內,沒有標註來源
的內容,皆採用 CC BY-NC-SA 3.0 授權條款釋出,反之皆以其來源之授權條款為準。