Skip to content

リアルタイムボイスチェンジャー Realtime Voice Changer

License

Notifications You must be signed in to change notification settings

stark-ydq/voice-changer

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

VC Client

English

What's New!

  • v.1.5.3.15

    • Improve:
      • new rmvpe checkpoint for rvc (torch, onnx)
      • Mac: upgrad torch version 2.1.0
  • v.1.5.3.14

    • Improve:
      • onnx performance (need to be converted)
    • Some fixes:
      • change default f0 det to onnx_rmvpe
      • disable unrecommnded f0 det on direct ml
    • Experimental
      • Add 16k RVC Sample (experimental)

VC Client とは

  1. 各種音声変換 AI(VC, Voice Conversion)を用いてリアルタイム音声変換を行うためのクライアントソフトウェアです。サポートしている音声変換 AI は次のものになります。
  1. 本ソフトウェアは、ネットワークを介した利用も可能であり、ゲームなどの高負荷なアプリケーションと同時に使用する場合などに音声変換処理の負荷を外部にオフロードすることができます。

image

  1. 複数のプラットフォームに対応しています。
  • Windows, Mac(M1), Linux, Google Colab (MMVC のみ)

使用方法

大きく 2 つの方法でご利用できます。難易度順に次の通りです。

  • 事前ビルド済みの Binary での利用
  • Docker や Anaconda など環境構築を行った上での利用

本ソフトウェアや MMVC になじみの薄い方は上から徐々に慣れていくとよいと思います。

(1) 事前ビルド済みの Binary での利用

  • Windows 版と Mac 版を提供しています。

    • Windows かつ Nvidia の GPU をご使用の方は、ONNX(cpu,cuda), PyTorch(cpu,cuda)をダウンロードしてください。
    • Windows かつ AMD/Intel の GPU をご使用の方は、ONNX(cpu,DirectML), PyTorch(cpu,cuda)をダウンロードしてください。AMD/Intel の GPU は onnx のモデルを使用する場合のみ有効になります。
    • いずれの GPU のサポート状況についても、PyTorch、Onnxruntime がサポートしている場合のみ有効になります。
    • Windows で GPU をご使用にならない方は、ONNX(cpu,cuda), PyTorch(cpu,cuda)をダウンロードしてください。
  • Windows 版は、ダウンロードした zip ファイルを解凍して、start_http.batを実行してください。

  • Mac 版はダウンロードファイルを解凍したのちに、startHttp.commandを実行してください。開発元を検証できない旨が示される場合は、再度コントロールキーを押してクリックして実行してください(or 右クリックから実行してください)。

  • 初回起動時は各種データをダウンロードします。ダウンロードに時間がかかる可能性があります。ダウンロードが完了すると、ブラウザが立ち上がります。

  • リモートから接続する場合は、.batファイル(win)、.commandファイル(mac)の http が https に置き換わっているものを使用してください。

  • DDPS-SVC の encoder は hubert-soft のみ対応です。

  • ダウンロードはこちらから。

Version OS フレームワーク link サポート VC サイズ
v.1.5.3.15 mac ONNX(cpu), PyTorch(cpu,mps) hugging face MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC 797MB
win ONNX(cpu,cuda), PyTorch(cpu,cuda) hugging face MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC 3240MB
win ONNX(cpu,DirectML), PyTorch(cpu,cuda) hugging face MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC 3125MB
v.1.5.3.14 mac ONNX(cpu), PyTorch(cpu,mps) hugging face MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC 797MB
win ONNX(cpu,cuda), PyTorch(cpu,cuda) hugging face MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC 3240MB
win ONNX(cpu,DirectML), PyTorch(cpu,cuda) hugging face MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC, DDSP-SVC, Diffusion-SVC 3125MB

(*1) Google Drive からダウンロードできない方はhugging_faceからダウンロードしてみてください (*2) 開発者が AMD のグラフィックボードを持っていないので動作確認していません。onnxruntime-directml を同梱しただけのものです。 (*3) 解凍や起動が遅い場合、ウィルス対策ソフトのチェックが走っている可能性があります。ファイルやフォルダを対象外にして実行してみてください。(自己責任です)

(2) Docker や Anaconda など環境構築を行った上での利用

本リポジトリをクローンして利用します。Windows では WSL2 の環境構築が必須になります。また、WSL2 上で Docker もしくは Anaconda などの仮想環境の構築が必要となります。Mac では Anaconda などの Python の仮想環境の構築が必要となります。事前準備が必要となりますが、多くの環境においてこの方法が一番高速で動きます。 GPU が無くてもそこそこ新しい CPU であれば十分動く可能性があります (下記のリアルタイム性の節を参照)

WSL2 と Docker のインストールの解説動画

WSL2 と Anaconda のインストールの解説動画

Docker での実行は、Docker を使用するを参考にサーバを起動してください。

Anaconda の仮想環境上での実行は、サーバ開発者向けのページを参考にサーバを起動してください。

トラブルシュート

リアルタイム性(MMVC)

GPU を使用するとほとんどタイムラグなく変換可能です。

https://twitter.com/DannadoriYellow/status/1613483372579545088?s=20&t=7CLD79h1F3dfKiTb7M8RUQ

CPU でも最近のであればそれなりの速度で変換可能。

https://twitter.com/DannadoriYellow/status/1613553862773997569?s=20&t=7CLD79h1F3dfKiTb7M8RUQ

古い CPU( i7-4770)だと、1000msec くらいかかってしまう。

開発者の署名について

本ソフトウェアは開発元の署名しておりません。下記のように警告が出ますが、コントロールキーを押しながらアイコンをクリックすると実行できるようになります。これは Apple のセキュリティポリシーによるものです。実行は自己責任となります。

image

Acknowledgments

  本ソフトウェアの音声合成には、フリー素材キャラクター「つくよみちゃん」が無料公開している音声データを使用しています。
  ■つくよみちゃんコーパス(CV.夢前黎)
  https://tyc.rei-yumesaki.net/material/corpus/
  © Rei Yumesaki

利用規約

  • リアルタイムボイスチェンジャーつくよみちゃんについては、つくよみちゃんコーパスの利用規約に準じ、次の目的で変換後の音声を使用することを禁止します。

■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)

■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。

■刺激の強い表現をゾーニングなしで公開すること。

■他者に対して二次利用(素材としての利用)を許可する形で公開すること。
※鑑賞用の作品として配布・販売していただくことは問題ございません。
  • リアルタイムボイスチェンジャーあみたろについては、あみたろの声素材工房様の次の利用規約に準じます。詳細はこちらです。
あみたろの声素材やコーパス読み上げ音声を使って音声モデルを作ったり、ボイスチェンジャーや声質変換などを使用して、自分の声をあみたろの声に変換して使うのもOKです。

ただしその場合は絶対に、あみたろ(もしくは小春音アミ)の声に声質変換していることを明記し、あみたろ(および小春音アミ)が話しているわけではないことが誰でもわかるようにしてください。
また、あみたろの声で話す内容は声素材の利用規約の範囲内のみとし、センシティブな発言などはしないでください。
  • リアルタイムボイスチェンジャー黄琴まひろについては、れぷりかどーるの利用規約に準じます。詳細はこちらです。

免責事項

本ソフトウェアの使用または使用不能により生じたいかなる直接損害・間接損害・波及的損害・結果的損害 または特別損害についても、一切責任を負いません。

(1) レコーダー(トレーニング用音声録音アプリ)

MMVC トレーニング用の音声を簡単に録音できるアプリです。 Github Pages 上で実行できるため、ブラウザのみあれば様々なプラットフォームからご利用可能です。 録音したデータは、ブラウザ上に保存されます。外部に漏れることはありません。

録音アプリ on Github Pages

解説動画

過去バージョン

Version OS フレームワーク link サポート VC サイズ
v.1.5.2.9e mac ONNX(cpu), PyTorch(cpu,mps) normal *1 MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC 796MB
win ONNX(cpu,cuda), PyTorch(cpu,cuda) normal *1 MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, so-vits-svc 4.0v2, RVC, DDSP-SVC 2872MB
v.1.5.3.1 mac ONNX(cpu), PyTorch(cpu,mps) normal *1 MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, RVC 796MB
win ONNX(cpu,cuda), PyTorch(cpu,cuda) normal *1 MMVC v.1.5.x, MMVC v.1.3.x, so-vits-svc 4.0, so-vits-svc 4.0v2, RVC, DDSP-SVC 2872MB

For Contributor

このリポジトリはCLAを設定しています。

About

リアルタイムボイスチェンジャー Realtime Voice Changer

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 68.8%
  • TypeScript 23.3%
  • CSS 4.1%
  • Jupyter Notebook 2.1%
  • Shell 1.0%
  • JavaScript 0.5%
  • Other 0.2%