src/utils.py

import math
import numpy as np
from skimage.io import imread
import os
import shutil
import matplotlib.pyplot as plt
from tqdm import tqdm
from PIL import Image


def split_picture(test_picture):
    split_1 = test_picture[:400, :400]
    split_2 = test_picture[:400, -400:]
    split_3 = test_picture[-400:, :400]
    split_4 = test_picture[-400:, -400:]
    return [split_1, split_2, split_3, split_4]


def merge_splits(split_1, split_2, split_3, split_4, mode='mean'):
    assert mode in ['mean', 'max'], 'mode can only be one between mean and max!'
    if mode == 'mean':
        function = np.mean
    elif mode == 'max':
        function = np.max
    intersect1 = function(np.array([split_1[:208, 208:], split_2[:208, :192]]), axis=0)
    intersect2 = function(np.array([split_3[192:, 208:], split_4[192:, :192]]), axis=0)

    intersect3 = function(np.array([split_1[208:, :208], split_3[:192, :208]]), axis=0)
    intersect4 = function(np.array([split_2[208:, 192:], split_4[:192, 192:]]), axis=0)

    intersect5 = function(np.array([split_1[208:, 208:], 
                                   split_2[208:, :192],
                                   split_3[:192, 208:],
                                   split_4[:192, :192]]), axis=0)

    north_west = split_1[:208, :208]
    north_east = split_2[:208, 192:]
    south_west = split_3[192:, :208]
    south_east = split_4[192:, 192:]

    upper_slice = np.concatenate([north_west, intersect1, north_east], axis= 1)
    middle_slice = np.concatenate([intersect3, intersect5, intersect4], axis= 1)
    lower_slice = np.concatenate([south_west, intersect2, south_east], axis= 1)

    final_image = np.concatenate([upper_slice, middle_slice, lower_slice], axis= 0)
    return final_image


def preprocess_test_images(test_images):
    preprocessed = []

    for image in test_images:
        preprocessed.extend(split_picture(image))

    return np.array(preprocessed)


def merge_predictions(predictions, mode='mean'):
    merged = []

    for i in range(0, len(predictions), 4):
        merged.append(merge_splits(predictions[i], predictions[i+1], predictions[i+2], predictions[i+3], mode))

    return merged


def single_model_training(model, save_path, additional_epochs=30, competition_epochs=60, b_size=8, loss='dice', l_rate_a=.0001, l_rate_b=.00001, v=1):
    print('Training model {}.\nParameters:'.format(model.net_type))
    print('\tbatch_size: {};\n\tloss: {};\n\tl_rate_google_data: {};\n\tl_rate_competition_data: {};'.format(b_size, loss, l_rate_a, l_rate_b))
    print('Training on additional data.')
    model.train(loss=loss, epochs=additional_epochs, train_on='google_data', l_rate=l_rate_a, batch_size=b_size, verb=v)
    print('Training on competition data.')
    model.train(loss=loss, epochs=competition_epochs, train_on='competition_data', l_rate=l_rate_b, batch_size=b_size, verb=v)
    print('Saving model at path: {}'.format(save_path))
    model.save_model(save_path)
    return


def save_predictions_pdf(net, config):
    numbers = net.test_data_gen.numbers
    sort_indices = np.argsort(numbers)
    numbers = np.array(numbers)[sort_indices].tolist()
    test_images = np.array(net.test_images)[sort_indices]
    test_predictions = np.array(net.test_images_predictions)[sort_indices]
    sub_outs = np.array(submission_outputs(config['submission_path'], numbers))

    dim = test_predictions[0].shape[0]

    images_path = config['submission_root'] + 'single_images/'
    os.makedirs(images_path, exist_ok=True)

    print('Preparing prediction images...')

    for i, num in tqdm(enumerate(numbers)):
        fig = plt.figure(figsize=(17, 9))
        fig.suptitle("Image #{}".format(num), fontsize=16)

        ax1 = plt.subplot2grid((1, 3), (0, 0))
        ax1.imshow(test_images[i])
        ax1.axis('off')
        ax1.set_title('Original Image')

        ax2 = plt.subplot2grid((1, 3), (0, 1))
        ax2.imshow(test_predictions[i].reshape(dim, dim), cmap= 'Greys_r')
        ax2.axis('off')
        ax2.set_title('Predicted Mask')

        ax3 = plt.subplot2grid((1, 3), (0, 2))
        ax3.imshow(sub_outs[i].reshape(dim, dim), cmap= 'Greys_r')
        ax3.axis('off')
        ax3.set_title('Submission Output')

        plt.savefig(images_path+'pic_{}.png'.format(i), transparent=True)
        plt.close()
    
    images = os.listdir(images_path)
    print('Outputting pdf of prediction images...')
    ims = []
    for i in tqdm(images):
        rgba = Image.open(images_path+i)
        rgb = Image.new('RGB', rgba.size, (255, 255, 255))  # white background
        rgb.paste(rgba, mask=rgba.split()[3])
        ims.append(rgb)
    
    first_im = ims[0]
    ims = ims[1:]

    first_im.save(config['figures_pdf'], "PDF" , resolution=100.0, save_all=True, append_images=ims)
    shutil.rmtree(images_path)


# the code below was rearranged by the code provided by the course's TAs
# and it's used to build masks from a submission csv file


def binary_to_uint8(img):
    rimg = (img * 255).round().astype(np.uint8)
    return rimg


def reconstruct_from_labels(lines, image_id):
    h = 16
    w = h
    imgwidth = int(math.ceil((600.0/w))*w)
    imgheight = int(math.ceil((600.0/h))*h)
    nc = 3
    
    im = np.zeros((imgwidth, imgheight), dtype=np.uint8)
    image_id_str = '%.3d_' % image_id
    for i in range(1, len(lines)):
        line = lines[i]
        if not image_id_str in line:
            continue

        tokens = line.split(',')
        id = tokens[0]
        prediction = int(tokens[1])
        tokens = id.split('_')
        i = int(tokens[1])
        j = int(tokens[2])

        je = min(j+w, imgwidth)
        ie = min(i+h, imgheight)
        if prediction == 0:
            adata = np.zeros((w,h))
        else:
            adata = np.ones((w,h))

        im[j:je, i:ie] = binary_to_uint8(adata)
        
    return im


def submission_outputs(label_file, numbers):
    f = open(label_file)
    lines = f.readlines()
    
    predictions = []
    for num in numbers:
        predictions.append(reconstruct_from_labels(lines, num))
    
    return predictions