modifypdf.py

"""
2014 February 12

Shane Bussmann

A collection of utilities for modifying posterior probability density
functions.

"""

from __future__ import print_function

from astropy.table import Table
import numpy


def trim(oldpdfloc, newpdfloc, niters=5000):

    # get the last niters iterations
    PDFdata = Table.read(oldpdfloc, format='ascii')
    PDFdata = PDFdata[-niters:]

    # write the trimmed list
    PDFdata.write(newpdfloc, format='ascii')

def bigScoop(PDFdata, Nbuffer=300):

    """ get model fits within Nbuffer of the best-fit model. """
    lnprob = PDFdata['lnprob']
    good = lnprob > lnprob.max() - Nbuffer
    PDFdata = PDFdata[good]

    # write the trimmed list
    return PDFdata

def goodMu(PDFdata):

    """ get model fits with mu < 100. """

    # search for magnification measurements
    lnprob = PDFdata['lnprob']
    good = lnprob > lnprob.max() - 300
    PDFdata = PDFdata[good]

    # write the trimmed list
    return PDFdata

def cleanColumns(PDFdata):

    # get the last niters iterations
    PDFkeys = PDFdata.keys()
    for key in PDFkeys:
        rms = numpy.std(PDFdata[key])
        if rms == 0:
            PDFdata.remove_column(key)

    # write the trimmed list
    return PDFdata

def prune(PDFdata, scaler=5.0, quiet=False):

    # get the last niters iterations
    #PDFdata = Table.read(oldpdfloc, format='ascii')
    okok = PDFdata['lnprob'] * 0 == 0
    PDFdata = PDFdata[okok]

    if not quiet:
        print("Pre-pruning, <Lnprob>: {:f}".format(PDFdata['lnprob'].mean()))
    #import pdb; pdb.set_trace()

    # identify the good fits
    lnprob = PDFdata['lnprob']
    #PDFdata['lnprob'] = lnprob
    minlnprob = lnprob.max()
    dlnprob = numpy.abs(lnprob - minlnprob)
    medlnprob = numpy.median(dlnprob)
    avglnprob = numpy.mean(dlnprob)
    skewlnprob = numpy.abs(avglnprob - medlnprob)
    rmslnprob = numpy.std(dlnprob)
    inliers = (dlnprob < scaler*rmslnprob)
    PDFdata = PDFdata[inliers]
    medlnprob_previous = 0.
    while skewlnprob > 0.1*medlnprob:
        lnprob = PDFdata['lnprob']
        minlnprob = lnprob.max()
        dlnprob = numpy.abs(lnprob - minlnprob)
        rmslnprob = numpy.std(dlnprob)
        inliers = (dlnprob < scaler*rmslnprob)
        PDFdatatmp = PDFdata[inliers]
        if len(PDFdatatmp) == len(PDFdata):
            inliers = (dlnprob < scaler/2.*rmslnprob)
        PDFdata = PDFdata[inliers]
        lnprob = PDFdata['lnprob']
        dlnprob = numpy.abs(lnprob - minlnprob)
        medlnprob = numpy.median(dlnprob)
        avglnprob = numpy.mean(dlnprob)
        skewlnprob = numpy.abs(avglnprob - medlnprob)
        if not quiet:
            print(medlnprob, avglnprob, skewlnprob)
        if medlnprob == medlnprob_previous:
            scaler /= 1.5
        medlnprob_previous = medlnprob

    #PDFdatagood = PDFdata.copy()
    # identify the good fits
    goodfits = (PDFdata['lnprob'] <= minlnprob)
    PDFdata = PDFdata[goodfits]

    # return the trimmed list
    #PDFdata.write(newpdfloc, format='ascii')
    return PDFdata