法向-深度扩散模型: 从文本生成法向图和深度图的扩散模型。
- 推理代码
- 训练代码
- 预训练模型: ND, ND-MV, Albedo-MV
- 预训练模型: ND-MV-VAE
- Objaverse数据集渲染的多视图图像
- 2023-12-25: mvs_objavse通过Alibaba OSS向外发布,我们提供了一个方便的多线程下载链接。
- 2023-12-11: 推理代码和预训练模型发布。
- 该代码仓库仅包含RichDreamer论文的扩散模型和2D图像生成代码
- 对于 3D 生成,请查看 RichDreamer.
- 使用以下脚本安装环境依赖
conda create -n nd
conda activate nd
pip install -r requirements.txt
pip install git+https://github.com/openai/CLIP.git
pip install git+https://github.com/CompVis/taming-transformers.git
pip install webdataset
pip install img2dataset
我们还提供了dockerfile来构建docker镜像。
sudo docker build -t mv3dengine_22.04:cu118 -f docker/Dockerfile .
- 下载预训练权重。
或者使用我们提供的下载脚本:
python tools/download_models/download_nd_models.py
我们提供了采样脚本
python demo_inference.sh
或使用以下详细说明:
# dmp求解器
python ./scripts/t2i.py --ckpt $ckpt_path --prompt $prompt --dpm_solver --n_samples 2 --save_dir $save_dir
# plms求解器
python ./scripts/t2i.py --ckpt $ckpt_path --prompt $prompt --plms --n_samples 2 --save_dir $save_dir
# ddim求解器
python ./scripts/t2i.py --ckpt $ckpt_path --prompt $prompt --n_samples 2 --save_dir $save_dir
# nd-mv
python ./scripts/t2i_mv.py --ckpt_path $ckpt_path --prompt $prompt --num_frames 4 --model_name nd-mv --save_dir $save_dir
# nd-mv-vae(即将推出)
python ./scripts/t2i_mv.py --ckpt_path $ckpt_path --prompt $prompt --num_frames 4 --model_name nd-mv-vae --save_dir $save_dir
python ./scripts/td2i_mv.py --ckpt_path $ckpt_path --prompt $prompt --depth_file $ depth_file --num_frames 4 --model_name albedo-mv --save_dir $save_dir
- 下载Laion-2B-en-5-AES(训练ND模型所需)
从parquet下载laion-2b数据集,然后将下载的文件放入./laion2b-dataset-5-aes
cd ./tools/download_dataset
bash ./download_2b-5_aes.sh
cd -
- 下载单目法向和深度图估计的网络权重(训练ND模型所需)
- NormalBae scannet.pt
- Midas3.1 dpt_beit_large512.pt
# 将scannet.pt移至normalbae Prior Model
mv scannet.pt ./libs/ControlNet-v1-1-nightly/annotator/normalbae/scannet.pt
# 将dpt_beit_large512.pt移至./libs/omnidata_torch/pretrained_models/dpt_beit_large_512.pt
mv dpt_beit_large512.pt ./libs/omnidata_torch/pretrained_models/dpt_beit_large_512.pt
- 下载Objaverse数据集渲染的多视图图像(训练ND-MV和Albedo-MV模型所需)
- 使用我们提供的多线程脚本下载我们渲染的数据集
# 下载文件位置信息的储存表
wget https://virutalbuy-public.oss-cn-hangzhou.aliyuncs.com/share/aigc3d/valid_paths_v4_cap_filter_thres_28.json
# 例子: python ./scripts/data/download_objaverse.py ./mvs_objaverse ./valid_paths_v4_cap_filter_thres_28.json 50
python ./scripts/data/download_objaverse.py /path/to/savedata /path/to/valid_paths_v4_cap_filter_thres_28.json nthreads(eg. 10)
# 设置软连接到数据集
ln -s /path/to/savedata mvs_objaverse
# 下载文本标注文件
wget https://virutalbuy-public.oss-cn-hangzhou.aliyuncs.com/share/aigc3d/text_captions_cap3d.json
- 下载在ImageNet上预训练的预训练-VAE权重: ${pretained-VAE weights}
- 修改
configs/autoencoder_normal_depth/autoencoder_normal_depth.yaml
中的配置文件, 设置model.ckpt_path=/path/to/${pretained-VAE weights}
# 训练 VAE
bash ./scripts/train_vae/train_nd_vae/train_rgbd_vae_webdatasets.sh \ model.ckpt_path=${pretained-VAE weights} \
data.params.train.params.curls='path_laion/{00000..${:5 end_id}}.tar' \
--gpus 0,1,2,3,4,5,6,7
经过 Normal-Depth-VAE 的训练,获得 Normal-Depth-VAE
模型或您可以从 ND-VAE 下载它
# 步骤1
export SD-MODEL-PATH=/path/to/sd-1.5
bash scripts/train_normald_sd/txt_cond/web_datasets/train_normald_webdatasets.sh --gpus 0,1,2,3,4,5,6,7 \
model.params.first_stage_ckpts=${Normal-Depth-VAE} model.params.ckpt_path=${SD-MODEL-PATH} \
data.params.train.params.curls='path_laion/{00000..${:5 end_id}}.tar'
# 步骤2 修改您的权重路径。configs/stable-diffusion/normald/sd_1_5/txt_cond/web_datasets/laion_2b_step2.yaml
bash scripts/train_normald_sd/txt_cond/web_datasets/train_normald_webdatasets_step2.sh --gpus 0,1,2,3,4,5,6,7 \
model.params.first_stage_ckpts=${Normal-Depth-VAE} \
model.params.ckpt_path=${pretrained-step-weights} \
data.params.train.params.curls='path_laion/{00000..${:5 end_id}}.tar'
经过 Normal-Depth-Diffusion 的训练,获取 Normal-Depth-Diffusion
模型或您可以从 ND 下载它,
我们提供了两种版本的 MultiView-Normal-Depth Diffusion 模型
a. 无VAE去噪 b. 带VAE去噪
在当前版本中,我们提供无VAE去噪
# a. 无 VAE 版本训练
bash ./scripts/train_normald_sd/txt_cond/objaverse/objaverse_finetune_wovae_mvsd-4.sh --gpus 0,1,2,3,4,5,6,7, \
model.params.ckpt_path=${Normal-Depth-Diffusion}
# b. VAE 版本训练
bash ./scripts/train_normald_sd/txt_cond/objaverse/objaverse_finetune_mvsd-4.sh --gpus 0,1,2,3,4,5,6,7, \
model.params.ckpt_path=${Normal-Depth-Diffusion}
经过 Normal-Depth-Diffusion 的训练,获得 Normal-Depth-Diffusion
模型或您可以从 ND 下载,
bash scripts/train_abledo/objaverse/objaverse_finetune_mvsd-4.sh --gpus 0,1,2,3,4,5,6,7, model.params.ckpt_path=${Normal-Depth-Diffusion}
我们大量参考了以下仓库的代码。感谢作者分享他们的代码。
@article{qiu2023richdreamer,
title={RichDreamer: A Generalizable Normal-Depth Diffusion Model for Detail Richness in Text-to-3D},
author={Lingteng Qiu and Guanying Chen and Xiaodong Gu and Qi zuo and Mutian Xu and Yushuang Wu and Weihao Yuan and Zilong Dong and Liefeng Bo and Xiaoguang Han},
year={2023},
journal = {arXiv preprint arXiv:2311.16918}
}