Skip to content

Latest commit

 

History

History
62 lines (48 loc) · 2 KB

README.md

File metadata and controls

62 lines (48 loc) · 2 KB

VStreamer Tool

AmiVoice Cloud Platform API, VOICEROID2, Google translation API v3 などと連携してそういう配信をするときに使う
以下の機能を実装

  1. 録音
  2. 文字起こし
  3. 音声合成
  4. 翻訳 (Google translation API v3)
  5. 字幕
  6. ボイスチェンジャー
    • RVC モデル
    • VC Client を参考にさせていただいております

設定

poetry で依存パッケージをインストール

# 文字起こし/字幕生成のみ
poetry install
# openai/whisper を文字起こしに使用する場合
poetry install -E whisper
# 録音/再生 (portaudio が必要)
poetry install -E audio
# openai whisper
poetry install -E whisper
# 音声合成
poetry install -E vroid2 # VOICEROID2
poetry install -E voicevox # Voicevox
# RVC
poetry install -E rvc
# gui (ttk)
poetry install -E gui

設定項目は config.toml.examplevspeech/config.py を参照してください。ごめんなさい。

VOICEROID2 を使う場合は 64bit 版エディターがダウンロードされている必要があります。

VOICEVOX を使う場合は指定したディレクトリ (デフォルト: ./voicevox_core) に と Open JTalk から配布されている辞書ファイルを配置してください。(onnxruntime も必要?)

詳細は voicevox_core_python_api の環境構築を確認してください。

whisper, RVC は対応するバージョンの cuda (11.8) がインストールされている必要があります。

実行

poetry run python -m vspeech --config ./config.toml

GUI

poetry run python -m gui -c config.toml