目前可以创建音色,复用音色,支持多人对话模式的生成,寻求帮助可以加入discord,注意输入的text不需要加[speed_3][laugh_2]这种手动控制的标签。
案例 : 多人对话 x 脱口秀
节点:
ChatTTS
Multi Person Podcast
CreateSpeakers
SaveSpeaker 、LoadSpeaker : 方便保存和加载音色,支持 ChatTTS_Speaker/summary 的音色加载
Load Whisper Model、Whisper Transcribe:方便导出音频对应的字幕文件
OpenVoiceClone :方便迁移音色,更好地控制角色声音
模型:
下载后放到 models/chat_tts
https://huggingface.co/2Noise/ChatTTS
音色pt文件放到models/chat_tts_speaker
openvoice 模型放到models/open_voice
whisper模型放到models/whisper/large-v3
分支是一个课程的示例代码:以ChatTTS为例,为ComfyUI增加语音合成功能。一个自定义的节点需要完成: python 运行时(后端)- 后端python怎么写 GUI - 怎么修改节点界面