Trajectory-wise Multiple Choice Learning for Generalization in Reinforcement Learning

TensorFlow implementation of "Trajectory-wise Multiple Choice Learning for Dynamics Generalization in Reinforcement Learning" (NeurIPS 2020).

Method

Trajectory-wise multiple choice learning (T-MCL) learns a multi-headed dynamics model for dynamics generalization. To effectively utilize specialized prediction heads, prediction heads are adaptively selected at evaluation time.

Instructions

Install required packages with below commands:

conda create -n tmcl python=3.6
pip install -r requirements.txt

Train and evaluate agents:

python -m run_scripts.run_tmcl --dataset [hopper/slim_humanoid/halfcheetah/cripple_ant] --normalize_flag

Reference

@inproceedings{seo2020trajectory,
  title={Trajectory-wise Multiple Choice Learning for Dynamics Generalization in Reinforcement Learning},
  author={Seo, Younggyo and Lee, Kimin and Clavera, Ignasi and Kurutach, Thanard and Shin, Jinwoo and Abbeel, Pieter},
  booktitle={Advances in Neural Information Processing Systems},
  year={2020}
}

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
figures		figures
run_scripts		run_scripts
tmcl		tmcl
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Trajectory-wise Multiple Choice Learning for Generalization in Reinforcement Learning

Method

Instructions

Reference

About

Releases

Packages

Languages

younggyoseo/trajectory_mcl

Folders and files

Latest commit

History

Repository files navigation

Trajectory-wise Multiple Choice Learning for Generalization in Reinforcement Learning

Method

Instructions

Reference

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages