evolution.py

import copy

from player import Player
import numpy as np
import random
import os


class Evolution:
    def __init__(self):
        self.game_mode = "Neuroevolution"

    def next_population_selection(self, players, num_players):
        """
        Gets list of previous and current players (μ + λ) and returns num_players number of players based on their
        fitness value.
        :param players: list of players in the previous generation
        :param num_players: number of players that we return
        """
        # TODO (Implement top-k algorithm here)
        sorted_players = sorted(players, key=lambda player: player.fitness, reverse=True)
        # TODO (Additional: Implement roulette wheel here)
        # generated_players = self.sus_rw(sorted_players, num_players, "rw")
        # TODO (Additional: Implement SUS here)
        generated_players = self.sus_rw(sorted_players, num_players, "sus")
        # TODO (Additional: Learning curve)
        # generated_players = self.q_tournament(sorted_players, num_players, 8)

        self.save_fitness(sorted_players)

        # print(sorted_players[0].fitness)
        return generated_players[: num_players]

    def generate_new_population(self, num_players, prev_players=None):
        """
        Gets survivors and returns a list containing num_players number of children.
        :param num_players: Length of returning list
        :param prev_players: List of survivors
        :return: A list of children
        """
        first_generation = prev_players is None
        if first_generation:
            return [Player(self.game_mode) for _ in range(num_players)]
        else:
            # TODO ( Parent selection and child generation )
            # new_players = prev_players  # DELETE THIS AFTER YOUR IMPLEMENTATION
            # new_players = self.crossover_players(prev_players)
            # new_players = self.sus_rw(prev_players, num_players, "sus")
            new_players = self.q_tournament(prev_players, num_players, 8)
            # new_players = self.sus_rw(prev_players, num_players, "rw")
            parents = self.crossover_players(new_players)
            for child in parents:
                self.mutate_player(child)
            # new_players = prev_players
            return parents

    def crossover_players(self, prev_players):
        """
        Apply crossover on players inorder to make new children.
        :param prev_players: List of survivors
        :return: List of crossover children
        """
        new_players = []

        for i in range(0, len(prev_players), 2):
            prev_players1 = prev_players[i]
            prev_players2 = prev_players[i + 1]

            new_player1 = self.clone_player(prev_players1)
            new_player2 = self.clone_player(prev_players2)

            random_number = np.random.uniform(0, 1, 1)
            if random_number > 0.5:

                for i in range(len(new_player1.nn.w)):
                    shape = new_player1.nn.w[i].shape
                    # weight
                    new_player1.nn.w[i][:, shape[1] // 2:] = prev_players2.nn.w[i][:, shape[1] // 2:]
                    new_player2.nn.w[i][:, shape[1] // 2:] = prev_players1.nn.w[i][:, shape[1] // 2:]
                    # bias
                    new_player1.nn.b[i][:, shape[1] // 2:] = prev_players2.nn.b[i][:, shape[1] // 2:]
                    new_player2.nn.b[i][:, shape[1] // 2:] = prev_players1.nn.b[i][:, shape[1] // 2:]

            new_players.append(new_player1)
            new_players.append(new_player2)

        return new_players

    def mutate_player(self, child):
        mutation_threshold = 0.2
        center = 0
        margin = 0.3

        for i in range(len(child.nn.w)):
            if np.random.random_sample() >= mutation_threshold:
                child.nn.w[i] += np.random.normal(center, margin, size=(child.nn.w[i].shape))
            if np.random.random_sample() >= mutation_threshold:
                child.nn.b[i] += np.random.normal(center, margin, size=(child.nn.b[i].shape))


    def clone_player(self, player):
        """
        Gets a player as an input and produces a clone of that player.
        """
        new_player = Player(self.game_mode)
        new_player.nn = copy.deepcopy(player.nn)
        new_player.fitness = player.fitness
        return new_player

    def sus_rw(self, players, num_players, g_type="sus"):
        next_generation = []
        total_fits = sum([player.fitness for player in players])
        probabilities = {}
        total_p = 0
        for i in range(len(players)):
            p = []
            p.append(total_p)
            total_p += players[i].fitness / total_fits
            p.append(total_p)
            probabilities[i] = p

        if g_type == "rw":
            pointers = [random.uniform(0, 1) for i in range(num_players)]
        else:
            step = 1 / num_players
            start_point = random.uniform(0, step)
            pointers = [start_point + i * step for i in range(num_players)]


        for p in pointers:
            # p = random.uniform(0, 1)
            for i in range(len(players)):
                if probabilities[i][0] <= p < probabilities[i][1]:
                    next_generation.append(self.clone_player(players[i]))
                    break
        return next_generation

    def q_tournament(self, players, num_players, q):
        next_generation = []

        for i in range(num_players):
            pointers = [random.randint(0, len(players)-1) for i in range(q)]
            fitness = {}
            for point in pointers:
                fitness[point] = players[point].fitness
            max_fitness = max(fitness, key=fitness.get)
            next_generation.append(self.clone_player(players[max_fitness]))


        return next_generation

    def save_fitness(self, players):
        fitness = [player.fitness for player in players]
        # print(fitness)
        best_fitness = players[0].fitness
        worst_fitness = players[len(players) - 1].fitness
        mean_fitness = sum(fitness) / len(fitness)
        print(players[0].fitness, players[len(players) - 1].fitness, mean_fitness)
        s = str(best_fitness) + " " + str(worst_fitness) + " " + str(mean_fitness)
        if not os.path.exists('fitness'):
            os.makedirs('fitness')

        f = open("fitness/output1.txt", "a")
        f.write(s)
        f.write("\n")
        f.close()