-
Notifications
You must be signed in to change notification settings - Fork 400
SDXL
hkz edited this page Nov 6, 2023
·
7 revisions
- 训练显存要求:24G VRAM(显存) 可以设置
rank=64
以及network alpha=32
完成训练;22G VRAM 可以按照默认参数完成训练;20G VRAM 可以设置rank=16
以及network alpha=8
完成训练。为了避免训练因为显存不足而中断,请耐心等待训练完成后,再进行 EasyPhoto Inference 或者 SD Web UI 上的操作(如 txt2img 等)。 - 训练数据要求:训练图片的分辨率尽可能得高 (1024*1024 以上),并确保人物头像在图片中的占比足够大(一半以上)。
- 其他注意事项:SDXL 训练请勿开启
validation
选项。如果还遇到显存不足的情况,请参考 #4-训练显存优化。
直接使用EasyPhoto训练出的SDXL的Lora模型,用于SDWebUI文生图效果优秀 ,提示词 (easyphoto_face, easyphoto, 1person) + LoRA
使用EasyPhoto 推理界面可以正常使用之前的所有功能
已征求相关测试同学同意 @Ye
- 我们在内部发布了一次双盲测试,当前 commitid 为 的版本的效果测评,sdxl 和 原1.5版本对比结果如下, 待发布。
- 同时我们提供了相关的显存使用情况和速度,在相同情况并使用默认参数下,SDXL 和 SD1 的性能对比:
A100 | 训练时间(s) | 峰值显存(GB) | 推理时间(s) | 推理峰值显存(GB) |
---|---|---|---|---|
SD1.5-r128 | 900 | 8525 | 55 | 14.7 |
SDXL-r32 | 2100 | 20.22 | 57 | 17.5 |
A10-xformers | 训练时间(s) | 峰值显存(GB) | 推理时间(s) | 推理峰值显存(GB) |
---|---|---|---|---|
SD1.5-128 | 900 | 27.5 | 14.7 | |
SDXL-r32 | 2040 | 20 | 41.5 | 17.5 |
SD Web UI 除了 Stable Diffusion Checkpoint 外,还预先在 GPU 中加载了 CodeFormer 等模型,通过下面的设置,可以再节约 1.5G 左右的 VRAM 用于训练,可以采用西面的修改启动项实现,但训练和推理需要切换启动项。
我们以秋叶包的绘世为例子,需要用户在启动前手动设置以下两个部分(需将新人改成专家模式)。感谢 @dancemanUK 提供操作流程图!
linux机器需要在启动webui服务打算训练时手动设置如下启动项即可。
- 训练启动项 --use-cpu all --no-half 如需训练,webui服务启动按照 python launch.py --use-cpu all --no-half
- 推理启动项 无 如果需要推理,训练后,重新启动webui服务,运行 python launch.py