validate.py

import logging
import numpy as np
import evaluation
import util.metrics as metrics


def norm_score(t2v_all_errors):
    t2v_all_score = -t2v_all_errors
    t2v_all_score = t2v_all_score - np.min(t2v_all_score)
    t2v_all_score = t2v_all_score / np.max(t2v_all_score)
    return -t2v_all_score



def cal_perf(t2v_all_errors, v2t_gt, t2v_gt,language, tb_logger=None, model=None):

    # video retrieval
    (t2v_r1, t2v_r5, t2v_r10, t2v_medr, t2v_meanr) = metrics.eval_q2m(t2v_all_errors, t2v_gt)
    t2v_map_score = metrics.t2v_map(t2v_all_errors, t2v_gt)

    # caption retrieval
    (v2t_r1, v2t_r5, v2t_r10, v2t_medr, v2t_meanr) = metrics.eval_q2m(t2v_all_errors.T, v2t_gt)
    v2t_map_score = metrics.v2t_map(t2v_all_errors, v2t_gt)

    logging.info(" * Text to Video {}:".format(language))
    logging.info(" * r_1_5_10, medr, meanr: {}".format([round(t2v_r1, 1), round(t2v_r5, 1), round(t2v_r10, 1), round(t2v_medr, 1), round(t2v_meanr, 1)]))
    logging.info(" * recall sum: {}".format(round(t2v_r1+t2v_r5+t2v_r10, 1)))
    logging.info(" * mAP: {}".format(round(t2v_map_score, 4)))
    logging.info(" * "+'-'*10)

    logging.info(" * Video to text {}:".format(language))
    logging.info(" * r_1_5_10, medr, meanr: {}".format([round(v2t_r1, 1), round(v2t_r5, 1), round(v2t_r10, 1), round(v2t_medr, 1), round(v2t_meanr, 1)]))
    logging.info(" * recall sum: {}".format(round(v2t_r1+v2t_r5+v2t_r10, 1)))
    logging.info(" * mAP: {}".format(round(v2t_map_score, 4)))
    logging.info(" * "+'-'*10)

    if tb_logger is not None:        
        # record metrics in tensorboard
        tb_logger.log_value('v2t_r1', v2t_r1, step=model.Eiters)
        tb_logger.log_value('v2t_r5', v2t_r5, step=model.Eiters)
        tb_logger.log_value('v2t_r10', v2t_r10, step=model.Eiters)
        tb_logger.log_value('v2t_medr', v2t_medr, step=model.Eiters)
        tb_logger.log_value('v2t_meanr', v2t_meanr, step=model.Eiters)

        tb_logger.log_value('t2v_r1', t2v_r1, step=model.Eiters)
        tb_logger.log_value('t2v_r5', t2v_r5, step=model.Eiters)
        tb_logger.log_value('t2v_r10', t2v_r10, step=model.Eiters)
        tb_logger.log_value('t2v_medr', t2v_medr, step=model.Eiters)
        tb_logger.log_value('t2v_meanr', t2v_meanr, step=model.Eiters)

        tb_logger.log_value('v2t_map', v2t_map_score, step=model.Eiters)
        tb_logger.log_value('t2v_map', t2v_map_score, step=model.Eiters)

    return (v2t_r1, v2t_r5, v2t_r10, v2t_medr, v2t_meanr, v2t_map_score), (t2v_r1, t2v_r5, t2v_r10, t2v_medr, t2v_meanr, t2v_map_score)



def validate(opt, tb_logger, vid_data_loader, text_data_loader, model, measure='cosine'):
    # compute the encoding for all the validation video and captions
    model.val_start()
    video_embs,video_ids = evaluation.encode_vid(model.embed_vis, vid_data_loader)
    cap_embs_en,cap_embs_zh,caption_ids = evaluation.encode_text(model.embed_txt, text_data_loader)

    t2v_all_errors_en,t2v_all_errors_zh = evaluation.cal_error(video_embs,cap_embs_en,cap_embs_zh, measure)
    v2t_gt, t2v_gt = metrics.get_gt(video_ids, caption_ids)

    (v2t_r1_en, v2t_r5_en, v2t_r10_en, v2t_medr_en, v2t_meanr_en, v2t_map_score_en), (t2v_r1_en, t2v_r5_en, t2v_r10_en, t2v_medr_en, t2v_meanr_en, t2v_map_score_en) = cal_perf(t2v_all_errors_en, v2t_gt, t2v_gt,'EN', tb_logger=tb_logger, model=model)
    (v2t_r1_zh, v2t_r5_zh, v2t_r10_zh, v2t_medr_zh, v2t_meanr_zh, v2t_map_score_zh), (t2v_r1_zh, t2v_r5_zh, t2v_r10_zh, t2v_medr_zh, t2v_meanr_zh, t2v_map_score_zh) = cal_perf(t2v_all_errors_zh, v2t_gt, t2v_gt,'ZH',tb_logger=tb_logger, model=model)
    currscore = 0
    if opt.val_metric == "recall":
        if opt.direction == 'i2t' or opt.direction == 'all':
            currscore += (v2t_r1_en + v2t_r5_en + v2t_r10_en + v2t_r1_zh + v2t_r5_zh + v2t_r10_zh)
        if opt.direction == 't2i' or opt.direction == 'all':
            currscore += (t2v_r1_en + t2v_r5_en + t2v_r10_en + t2v_r1_zh + t2v_r5_zh + t2v_r10_zh)
    elif opt.val_metric == "map":
        if opt.direction == 'i2t' or opt.direction == 'all':
            currscore += v2t_map_score_en+v2t_map_score_zh
        if opt.direction == 't2i' or opt.direction == 'all':
            currscore += t2v_map_score_en+t2v_map_score_zh

    tb_logger.log_value('rsum', currscore, step=model.Eiters)

    return currscore