run_test_decoding.py

import argparse
import os

import torch
from tqdm import tqdm

from config_loader.config import extend_compatibility_for_paa_transformer
from dataset.dataset import PersonaChatDataset, get_dataloader
from evaluation.evaluation_helper import eval_distinct_avg
from model.causal_decoder.conv_gpt import cut_special_tokens
from utils.get_model_by_config import get_model_via_config
from utils.get_tokenizer import get_tokenizer
from utils.parser_helper import str2bool
from utils.save_load_model import load_model


def save_generated_text(result_str, ground_truth, predicted, exp_name, force_acc_auto_tau, temperature, prefix=None):
    assert len(ground_truth) == len(predicted), 'length must equal!'
    text = result_str + "\n" + "=" * 10 + "\n"
    for gt, pred in zip(ground_truth, predicted):
        text += "GT: {}\n".format(gt)
        text += "PD: {}\n".format(pred)
        text += "=" * 10 + "\n"
    folder = "generated_text/test"
    if prefix is not None:
        folder = "generated_text/test/{}".format(prefix)
    os.makedirs(folder, exist_ok=True)
    if force_acc_auto_tau:
        filename = "{}/T={}-ACC_AUTO_TAU-{}.txt".format(folder, temperature, exp_name)
    else:
        filename = "{}/T={}-{}.txt".format(folder, temperature, exp_name)
    with open(filename, 'w') as file:
        file.write(text)


parser = argparse.ArgumentParser()
parser.add_argument('--mdir', type=str, default=None)
parser.add_argument('--model_path', type=str, default='ckpt/paa.pt')
parser.add_argument('--prefix', type=str, default=None)
parser.add_argument('--max_bz', type=int, default=32)
parser.add_argument('--min_bz', type=int, default=32)
parser.add_argument('--force_acc_auto_tau', type=str2bool, default=False)
parser.add_argument('--worker', type=int, default=0)
parser.add_argument('--temperature',type=float, default=0)
# config_path = 'baseline/config/gpt2-small.yml'
from glob import glob
args = parser.parse_args()
force_acc_auto_tau = args.force_acc_auto_tau
temperature = args.temperature
MAX_BATCH_SIZE = args.max_bz
MIN_BATCH_SIZE = args.min_bz
if MAX_BATCH_SIZE < MIN_BATCH_SIZE:
    MAX_BATCH_SIZE = MIN_BATCH_SIZE
mdir = args.mdir
result = []
model_paths = glob("{}/*/best.pt".format(mdir))
if args.model_path is not None:
    model_paths = [args.model_path]
for model_path in model_paths:
    skip = False
    for entry in result:
        if model_path in entry:
            print("Skip")
            skip = True
            break
    if skip:
        continue

    checkpoint = torch.load(model_path, map_location='cpu')
    config = checkpoint['config']
    if force_acc_auto_tau:
        config.paa_transformer.decoder.auto_tau = 'accurate'
    if config.training.batch_size < MIN_BATCH_SIZE:
        config.training.batch_size = MIN_BATCH_SIZE
    if config.training.batch_size > MAX_BATCH_SIZE:
        config.training.batch_size = MAX_BATCH_SIZE
    config = extend_compatibility_for_paa_transformer(config)
    tokenizer = get_tokenizer(config.tokenizer.vocab)
    max_context_turns = config.dataset.max_context_turns
    test_dataset = PersonaChatDataset(config.dataset.test, tokenizer.sep_token, max_context_turns=max_context_turns)
    test_dataloader = get_dataloader(test_dataset, tokenizer, config, num_workers=args.worker, batch_size_ratio=1)
    model = get_model_via_config(config, tokenizer)
    model.to('cuda')
    load_model(model, path=model_path)
    target_texts = []
    preds_texts = []
    pbar = tqdm(test_dataloader, desc='decoding tokens')
    for data in pbar:
        pred_text = model.generate(data)
        target = data['target_input']['input_ids']
        target_text = tokenizer.batch_decode(cut_special_tokens(target, tokenizer))
        preds_texts += pred_text
        target_texts += target_text
        pbar.set_postfix_str(pred_text[0])

    dist1, dist2, avg_dist = eval_distinct_avg(preds_texts)
    result_str = """
    dist1: {}
    dist2: {}
    avg_dist: {}
    """.format(dist1, dist2, avg_dist)
    print(result_str)
    save_generated_text(result_str, target_texts, preds_texts, config.experiment.name, force_acc_auto_tau, temperature, prefix=args.prefix)
    del model