adv.py

import torch.nn as nn
import torch
import numpy as np

class Discriminator(nn.Module):
    def __init__(self,
                 level,
                 grad_reverse=False,
                 scale=1.0):
        super(Discriminator, self).__init__()
        # word or sentence
        self.level = level
        self.grad_reverse = grad_reverse
        self.scale = scale

    def count_parameters(self):
        param_dict = {}
        for name, param in self.named_parameters():
            if param.requires_grad:
                param_dict[name] = np.prod(param.size())
        return param_dict

    def forward(self, input):
        
        #input = input.unsqueeze(1)
        #assert input.dim() == 3
        # if self.grad_reverse:
        #     input = grad_reverse(input, self.scale)

        #output = self._run_forward_pass(input)
        #if self.level == 'sent':
        #    output = torch.mean(output, dim=1)
        return self.model(input)


class LR(Discriminator):
    """A simple discriminator for adversarial training."""

    def __init__(self, nhid, level, nclass=1, grad_reverse=False, scale=1.0):
        super(LR, self).__init__(level, grad_reverse, scale)

        self.model = nn.Linear(nhid, nclass)

    def _run_forward_pass(self, input):

        return input

class ResBlock(nn.Module):
    def __init__(self, nhid):
        super(ResBlock, self).__init__()

        self.relu = nn.ReLU(True)
        self.conv1 = nn.Conv1d(nhid, nhid, 5, padding=2)
        self.conv2 = nn.Conv1d(nhid, nhid, 5, padding=2)

    def forward(self, inputs):
        """"Defines the forward computation of the discriminator."""
        assert inputs.dim() == 3
        output = inputs
        output = self.relu(output)
        output = self.conv1(output)
        output = self.relu(output)
        output = self.conv2(output)
        return inputs + (0.3 * output)


# ref: https://github.com/igul222/improved_wgan_training/blob/master/gan_language.py#L75
class ConvDiscriminator(Discriminator):
    def __init__(self,
                 nhid,
                 mhid,
                 level,
                 nclass=1,
                 grad_reverse=False,
                 scale=1.0):
        super(ConvDiscriminator, self).__init__(level, grad_reverse, scale)

        self.convolve = nn.Sequential(
            nn.Conv1d(nhid, mhid, 1),
            ResBlock(mhid),
            ResBlock(mhid),
            ResBlock(mhid)
        )
        self.model = nn.Linear(mhid, nclass)

    def _run_forward_pass(self, input):
        """"Defines the forward computation of the discriminator."""
        output = input.transpose(1, 2)
        output = self.convolve(output)
        output = output.transpose(1, 2)
        return output


class MLP(Discriminator):
    """A simple discriminator for adversarial training."""

    def __init__(self,
                 nhid,
                 level,
                 nclass=1,
                 grad_reverse=False,
                 scale=1.0):
        super(MLP, self).__init__(level, grad_reverse, scale)

        self.model = nn.Sequential(
            nn.Linear(nhid, 256),
            nn.Tanh(),
            nn.Linear(256, 128),
            nn.Tanh(),
            nn.Linear(128, nclass)
        )

    def _run_forward_pass(self, input):
        return input


class Adversarial(nn.Module):
    def __init__(self, input_size, train_level, nclass, train_type, momentum, gamma, eps, betas, lr, reverse_grad, scale, optim, disc_type):
        super(Adversarial, self).__init__()

        self.train_type = train_type
        self.reverse_grad = reverse_grad
        self.scale = scale

        if disc_type == 'weak':
            self.discriminator = LR(input_size, level=train_level, nclass=nclass, grad_reverse=reverse_grad, scale=scale)
        elif disc_type == 'not-so-weak':
            self.discriminator = MLP(input_size, level=train_level, nclass=nclass)
        elif disc_type == 'strong':
            self.discriminator = ConvDiscriminator(input_size, mhid=128, level=train_level, nclass=nclass)

        self.optim = self.generate_optimizer(optim, lr, self.discriminator.parameters(),
                                        betas, gamma, eps, momentum)

        self.criterion = nn.CrossEntropyLoss() if self.train_type == 'GR' else nn.BCEWithLogitsLoss()

        # real--EN/ fake--trans
        self.real = 1
        self.fake = 0

        self.train_type = train_type

    def generate_optimizer(self, optim, lr, params, betas, gamma, eps, momentum):

        params = filter(lambda param: param.requires_grad, params)

        from torch.optim import Adam, SGD, Adamax

        if optim == 'adam':
            return Adam(params, lr=lr, betas=betas, weight_decay=gamma, eps=eps)
        elif optim == 'sgd':
            return SGD(params, lr=lr, momentum=momentum, weight_decay=gamma, nesterov=True)
        elif optim == 'adamax':
            return Adamax(params, lr=lr, betas=betas, weight_decay=gamma, eps=eps)
        else:
            raise ValueError('Unknown optimization algorithm: %s' % optim)

    def loss(self, input, label):

        output = self.discriminator(input)

        #if output.dim() == 3:
        #    output = output.contiguous().view(-1, output.size(2))

        if self.train_type == 'WGAN':
            loss = torch.mean(output)

        else:
            if self.train_type == 'GAN':
                labels = torch.zeros_like(output)
                labels[:, label].fill_(1)
                labels = labels.type_as(output)
            elif self.train_type == 'GR':
                labels = torch.empty(output.size(0)).fill_(label).type_as(output).long()
            loss = self.criterion(output, labels)

        return output, loss

    def accuracy(self, output, label):

        preds = torch.argmax(output, dim=-1).cpu()
        labels = torch.LongTensor([label])
        labels = labels.expand(*preds.size())
        n_correct = preds.eq(labels).sum().item()
        acc = 1.0 * n_correct / output.size(0)

        return acc

    def update(self, real_in, fake_in, real_id, fake_id):
        self.optim.zero_grad()

        if self.train_type == 'GAN':
            real_id, fake_id = self.real, self.fake

        real_out, real_loss = self.loss(real_in, 1)
        fake_out, fake_loss = self.loss(fake_in, 0)
        #if self.train_type in ['GR', 'GAN']:
        loss = 0.5 * (real_loss + fake_loss)
        #else:
        #    loss = fake_loss - real_loss

        # Note: usually gradient clipping is not required
        # clip_grad_norm_(self.discriminator.parameters(), self.clip_disc)
        loss.backward()
        self.optim.step()

        real_acc, fake_acc = 0, 0
        if self.train_type in ['GR', 'GAN']:
            real_acc = self.accuracy(real_out, real_id)
            fake_acc = self.accuracy(fake_out, fake_id)

        return real_loss.item(), fake_loss.item(), real_acc, fake_acc

    def gen_loss(self, real_in, fake_in, real_id, fake_id):
        """Function to calculate loss to update the Generator in adversarial training."""

        if self.train_type == 'GR':
            _, real_loss = self.loss(real_in, real_id)
            _, fake_loss = self.loss(fake_in, fake_id)
            loss = 0.5 * (real_loss + fake_loss)
            if not self.reverse_grad:
                loss = -self.scale * loss

        elif self.train_type == 'GAN':
            _, loss = self.loss(real_in, self.fake)
            loss = self.scale * loss
            # _, loss = self.loss(real_in, self.real)
            # loss = -self.scale * loss

        # ref: https://github.com/eriklindernoren/PyTorch-GAN/blob/master/implementations/wgan/wgan.py
        elif self.train_type == 'WGAN':
            for p in self.discriminator.parameters():
                p.data.clamp_(-0.01, 0.01)

            _, loss = self.loss(fake_in, self.real)
            loss = -self.scale * loss

        else:
            raise NotImplementedError()

        return loss