2021.3.13 PaddleGAN SIG meeting note

20213月13日 Paddle SIG 周会记录

时间：北京时间20：00~21：00

当前正在推进项目进度同步：

DCGAN：@韩杰已完成 StyleGAN2：@艾梦已完成(预测版本) Pix2Style2Pix：@艾梦已完成 AnimeGAN @愚鱼已完成 Photo2Cartoon @郝强, 已完成 First Order训练版：@李果，基本完成，待合入 Wave2lip：已完成 -Tutorial @此方 -Generator + inference @李晓波 Wav2lip + hq_wav2lip + Dataloader 已完成，模型体积压缩中 DRN @已完成美甲创意项目 @Habout 人脸超分DFDNet @Kevin StarGAN：@李杨柳

StarGANv2：动物生成 Amity 应用Pytorch完成，可以考虑应用Paddle版本复现

2D图像—>3D图像生成 @甄昊天论文：https://arxiv.org/abs/1904.04290 参考Repo： https://github.com/google/neural_rerendering_in_the_wild 视频效果： https://www.youtube.com/watch?v=E1crWQn_kmY

deepfill v2 @韩杰作用：图片修复，还原图片中缺失的部分论文：https://arxiv.org/abs/1806.03589 参考repo：https://github.com/yangyu12/deepfill_v2.pytorch ； https://github.com/JiahuiYu/generative_inpainting

lip2wav @夕月论文： https://arxiv.org/pdf/2005.08209.pdf 新闻：https://www.reddit.com/r/artificial/comments/gu1s3d/lip2wav_synthesize_speech_only_from_the_lip/

图像去模糊 @李杨柳训练数据需要清晰&模糊成对匹配 DeblurGAN-v2 SRN-DeblurNet Deep Image Ankonwledge 待领取（不分先后顺序）

AI深度估计（非GAN方向，但如果大家感兴趣可以考虑）论文： https://arxiv.org/pdf/1904.11111.pdf 画面扩充（例如把原片从4:3变成16:9宽画幅）https://github.com/vt-vl-lab/FGVC 老照片修复 https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life 2021年规划讨论：

影像超分艺术圈大家对AI比较感兴趣，扩圈可行，题材是重点渠道：B站鬼畜区、虚拟偶像、dameidamei 题材：简笔画生成真实画像，水墨画一笔一笔生成 AI变声（柯南）人体动作迁移（分辨率较低 2k）https://www.impersonator.org/work/impersonator-plus-plus.html 数据生成（戴眼镜的、头部姿态改变等等）ToDo:PADDLE思路共享语音克隆 ToDo:找语音团队支持时间穿行：https://time-travel-rephotography.github.io/ https://arxiv.org/pdf/2012.12261.pdf

其他有用的素材：

Voice Clone：https://github.com/CorentinJ/Real-Time-Voice-Cloning
影像上色 https://github.com/zhangmozhe/Deep-Exemplar-based-Video-Colorization； Paddle 版本3月底实现
人脸数据集： ① http://www.seeprettyface.com/mydataset.html ② http://www.jdl.ac.cn/peal/
动物人脸生成： https://thisfursonadoesnotexist.com/
人脸生成： https://www.artbreeder.com/
反AI现有的技术实现：【技术实现方式】 1.基于帧间时间特性的方法：利用视频内人眨眼频率、嘴型等时间相关的特性进行判断 2.基于帧内视觉效果的方法：利用图像边缘的瑕疵以及五官位置、面部阴影等不自然的细节进行判断，通常提取特定特征后用深层或浅层的分类器完成检测 3.区块链解决方案：使用区块链的解决方案和通用框架，以追踪数字内容的来源和历史，即使数字内容被多次复制也可对其进行溯源【现有的技术实现】CNNDetection（https://github.com/PeterWang512/CNNDetection）--基于频谱的分类器，针对不仅GAN，任何CNN生成的假图均可识别 Face X-ray（https://paperswithcode.com/paper/face-x-ray-for-more-general-face-forgery#code）--预测图像混合区域，检测并清晰画出换脸边界，目前只有非官方复现代码【开源数据集】
Face Forensics（124kAI生成视频）：https://ai.facebook.com/datasets/dfdc/
CNNDetection（72张训练集，4000张测试集）：https://github.com/PeterWang512/CNNDetection#3-dataset
DeeperForensics-1.0 （48475源视频，11000“伪视频”）：https://github.com/EndlessSora/DeeperForensics-1.0/tree/master/dataset
Celeb-DF（590源视频，5639“伪视频”，需要发邮件获得数据集）：https://github.com/yuezunli/celeb-deepfakeforensics
DFDC（119154训练集，4000验证集半数“伪视频”，10000测试集）：https://www.kaggle.com/c/deepfake-detection-challenge/data
deepfake in the wild（7314序列抽取于707“伪视频”）：https://github.com/deepfakeinthewild/deepfake-in-the-wild
部分数量比较小的数据集：https://blog.csdn.net/where_is_horse/article/details/102790866

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

2021.3.13 PaddleGAN SIG meeting note

Clone this wiki locally