feat: first recut model

jolibrain · Jun 22, 2021 · aaa4069 · aaa4069
1 parent 836b904
commit aaa4069
Showing 1 changed file with 186 additions and 0 deletions.
diff --git a/models/re_cut_semantic_mask_model.py b/models/re_cut_semantic_mask_model.py
@@ -0,0 +1,186 @@
+import torch
+import itertools
+from .cut_semantic_mask_model import CUTSemanticMaskModel
+from . import networks
+from torch.autograd import Variable
+import numpy as np
+import torch.nn.functional as F
+from .modules import loss
+from util.iter_calculator import IterCalculator
+from util.network_group import NetworkGroup
+
+class ReCUTSemanticMaskModel(CUTSemanticMaskModel):
+
+    def modify_commandline_options(parser, is_train=True):
+        parser = CUTSemanticMaskModel.modify_commandline_options(parser,is_train)
+        parser.add_argument('--adversarial_loss_p',action='store_true',help='if True, also train the prediction model with an adversarial loss')
+        parser.add_argument('--nuplet_size', type=int, default=3,help='Number of frames loaded')
+        parser.add_argument('--netP', type=str, default='unet_128', help='specify P architecture [resnet_9blocks | resnet_6blocks | resnet_attn | unet_256 | unet_128]')
+        parser.add_argument('--no_train_P_fake_images',action='store_true',help='if True, P wont be trained over fake images projections')
+        parser.add_argument('--projection_threshold',default=1.0,type=float,help='threshold of the real images projection loss below with fake projection and fake reconstruction losses are applied')
+        parser.add_argument('--P_lr', type=float, default=0.0002, help='initial learning rate for P networks')
+        return parser
+
+
+    def __init__(self, opt):
+        super().__init__(opt)
+
+        if self.opt.iter_size == 1:
+            if self.opt.adversarial_loss_p:
+                self.loss_names_G += ["proj_fake_B_adversarial"]
+            self.loss_names_G += ["recut","proj_real_B"]
+            self.loss_names_P = ["proj_real_B"]
+            if self.opt.adversarial_loss_p:
+                self.loss_names_P += ["proj_real_A_adversarial","proj_real_B_adversarial"]
+        else:
+            if self.opt.adversarial_loss_p:
+                self.loss_names_G += ["proj_fake_B_adversarial_avg"]
+            self.loss_names_G += ["recut_avg"]
+            self.loss_names_P = ["proj_real_B_avg"]
+            if self.opt.adversarial_loss_p:
+                self.loss_names_P = ["proj_real_B_adversarial_avg"]
+
+        self.loss_names = self.loss_names_G + self.loss_names_f_s + self.loss_names_D + self.loss_names_P
+
+        if self.opt.iter_size > 1 :
+            self.iter_calculator = IterCalculator(self.loss_names)
+            for loss_name in self.loss_names:
+                setattr(self, "loss_" + loss_name, 0)
+
+        self.visual_names += [["real_A_last","proj_fake_B"],["real_B_last","proj_real_B"]]
+
+        self.netP_B = networks.define_G((self.opt.nuplet_size-1) * opt.input_nc, opt.output_nc,opt.ngf, opt.netP, opt.norm, not opt.no_dropout, opt.G_spectral, opt.init_type, opt.init_gain,self.gpu_ids,padding_type=opt.G_padding_type,opt=self.opt)
+        self.model_names += ["P_B"]
+
+        self.optimizer_P = torch.optim.Adam(itertools.chain(self.netP_B.parameters()),lr=opt.P_lr, betas=(opt.beta1, 0.999))
+        self.optimizers.append(self.optimizer_P)
+
+        if self.opt.no_train_P_fake_images:
+            self.group_P = NetworkGroup(networks_to_optimize=["P_B"],forward_functions=["forward_P"],backward_functions=["compute_P_loss"],loss_names_list=["loss_names_P"],optimizer=["optimizer_P"],loss_backward=["loss_P"])
+            self.networks_groups.insert(1,self.group_P)
+        else: # P and G networks will be trained in the same time
+            self.group_G = NetworkGroup(networks_to_optimize=["G","P_B"],forward_functions=["forward","forward_P"],backward_functions=["compute_G_loss","compute_P_loss"],loss_names_list=["loss_names_G","loss_names_P"],optimizer=["optimizer_G","optimizer_P"],loss_backward=["loss_G","loss_P"])
+            self.networks_groups[0] = self.group_G
+
+        self.criterionCycle = torch.nn.L1Loss()
+
+    def set_input(self, input):
+        super().set_input(input)
+        batch_size,nuplet,channels,h,w=self.real_A.shape
+        self.shape_fake=[batch_size,(nuplet-1)*channels,h,w]
+        self.real_A_last = self.real_A[:,-1]
+        self.real_B_last = self.real_B[:,-1]
+        self.input_A_label_last = self.input_A_label[:,-1]
+        self.input_B_label_last = self.input_B_label[:,-1]
+
+        self.real_A =self.real_A[:,:-1]
+        self.real_B =self.real_B[:,:-1]
+        self.input_A_label = self.input_A_label[:,:-1]
+        self.input_B_label = self.input_B_label[:,:-1]
+
+        self.real_A = torch.flatten(self.real_A,start_dim=0,end_dim=1)
+        self.real_B = torch.flatten(self.real_B,start_dim=0,end_dim=1)
+        self.input_A_label = torch.flatten(self.input_A_label,start_dim=0,end_dim=2)
+        self.input_B_label = torch.flatten(self.input_B_label,start_dim=0,end_dim=2)
+
+    def data_dependent_initialize(self, data):
+        self.set_input(data)
+        bs_per_gpu = self.real_A.size(0) // max(len(self.opt.gpu_ids), 1)
+        self.shape_fake[0]=bs_per_gpu
+        self.real_A = self.real_A[:bs_per_gpu]
+        self.real_B = self.real_B[:bs_per_gpu]
+        self.input_A_label=self.input_A_label[:bs_per_gpu]
+        if hasattr(self,'input_B_label'):
+            self.input_B_label=self.input_B_label[:bs_per_gpu]
+        self.forward()                     # compute fake images: G(A)
+        self.forward_P()
+        if self.opt.isTrain:
+            self.compute_P_loss()                   
+            self.compute_D_loss()                  
+            self.compute_f_s_loss()
+            self.compute_G_loss()                   
+            self.loss_D.backward()# calculate gradients for D
+            self.loss_f_s.backward()# calculate gradients for f_s
+            self.loss_G.backward()# calculate gradients for G
+            self.loss_P.backward()# calculate gradients for P
+            if self.opt.lambda_NCE > 0.0:
+                self.optimizer_F = torch.optim.Adam(self.netF.parameters(), lr=self.opt.lr, betas=(self.opt.beta1, self.opt.beta2))
+                self.optimizers.append(self.optimizer_F)
+
+        for optimizer in self.optimizers:
+            optimizer.zero_grad()
+
+        visual_names_seg_A = ['input_A_label','gt_pred_A','pfB_max']
+
+        if hasattr(self,'input_B_label'):
+            visual_names_seg_B = ['input_B_label']
+        else:
+            visual_names_seg_B = []
+
+        visual_names_seg_B += ['gt_pred_B']
+
+        self.visual_names += [visual_names_seg_A,visual_names_seg_B]
+
+        if self.opt.out_mask and self.isTrain:
+            visual_names_out_mask_A = ['real_A_out_mask','fake_B_out_mask']
+            self.visual_names += [visual_names_out_mask_A]
+
+
+    def forward(self):
+        #self.shape_fake=[self.get_current_batch_size(),(self.opt.nuplet_size-1)*channels,self.opt.crop_size,self.opt.crop_size]
+        super().forward()
+        ## Projection next time step over fake images
+        self.proj_fake_B = self.netP_B(self.fake_B.reshape(self.shape_fake))
+
+    def compute_G_loss(self):
+        super().compute_G_loss()
+
+        ## GAN loss over fake images projection for G (and P if no_train_P_fake_images is False)
+        if self.opt.adversarial_loss_p:
+            self.loss_proj_fake_B_adversarial = self.compute_G_loss_GAN_generic(self.netD,"B",self.D_loss,fake_name="proj_fake_B")
+        else:
+            self.loss_proj_fake_B_adversarial = 0
+
+        ## Recycle loss between fake images projection reconstruction and ground truth
+        if not hasattr(self, 'loss_proj_real_B') or (self.loss_proj_real_B.detach().item()) > self.opt.projection_threshold: #if P networks aren't accurate enough on real images, we don't use them on fake images:
+            self.loss_recut = 0
+            self.loss_proj_fake_B_adversarial = 0
+
+        else:
+            self.loss_recut = self.calculate_NCE_loss(self.real_A_last, self.proj_fake_B)
+
+        self.loss_G += self.loss_proj_fake_B_adversarial + self.loss_recut
+
+    def forward_P(self):
+        ## Real images projection
+        self.proj_real_B = self.netP_B(self.real_B.reshape(self.shape_fake))
+
+    def compute_P_loss(self):
+        ## Pixel to pixel loss between real images projection and ground truth
+        lambda_P=10
+        self.loss_proj_real_B = self.criterionCycle(self.proj_real_B, self.real_B_last) * lambda_P
+
+        ## GAN loss over real images projection for P
+        if self.opt.adversarial_loss_p:
+            self.loss_proj_real_B_adversarial=self.compute_G_loss_GAN_generic(self.netD,"B",self.D_loss,fake_name="proj_real_B")
+        else:
+            self.loss_proj_real_B_adversarial = 0
+
+        self.loss_P = self.loss_proj_real_B + self.loss_proj_real_B_adversarial
+
+    def compute_D_loss(self):
+        super().compute_D_loss()
+        ## GAN loss over fake images projections for D
+        self.loss_D += self.compute_D_loss_generic(self.netD,"B",self.D_loss,real_name="real_B_last",fake_name="proj_fake_B")
+
+        ## GAN loss over real images projections for D
+        self.loss_D += self.compute_D_loss_generic(self.netD,"B",self.D_loss,real_name="real_B_last",fake_name="proj_real_B")
+
+        if self.opt.netD_global != "none":
+            ## GAN loss over fake images projections for D_global
+            self.loss_D_global += self.compute_D_loss_generic(self.netD_global,"B",self.D_global_loss,real_name="real_B_last",fake_name="proj_fake_B")
+
+            ## GAN loss over real images projections for D_global
+            self.loss_D_global += self.compute_D_loss_generic(self.netD_global,"B",self.D_global_loss,real_name="real_B_last",fake_name="proj_real_B")
+
+        self.loss_D = self.loss_D + self.loss_D_global