OmniSafe's Mujoco Velocity Benchmark on SafeRL algorithms

The OmniSafe Mujoco Velocity Benchmark assesses the efficacy of OmniSafe's SafeRL algorithms in six environments from the Safety-Gymnasium task suite. For each supported algorithm and environment, we offer default hyperparameters utilized during the benchmark, as well as scripts to replicate the results. Additionally, we provide performance comparisons and code-level details with other open-source implementations or classic papers. Our package includes graphs and raw data that can be used for research purposes, along with log details from training. Finally, we offer hints on fine-tuning the algorithm for optimal results.

On-Policy

Supported Algorithms

First-Order

[NIPS 1999] Policy Gradient(PG)
Proximal Policy Optimization (PPO)
The Lagrange version of PPO (PPO-Lag)
[IJCAI 2022] Penalized Proximal Policy Optimization for Safe Reinforcement Learning(P3O)
[NeurIPS 2020] First Order Constrained Optimization in Policy Space (FOCOPS)
[NeurIPS 2022] Constrained Update Projection Approach to Safe Policy Optimization (CUP)

Second-Order

[NeurIPS 2001] A Natural Policy Gradient (NaturalPG))
[PMLR 2015] Trust Region Policy Optimization (TRPO)
The Lagrange version of TRPO (TRPO-Lag)
[ICML 2017] Constrained Policy Optimization (CPO)
[ICML 2017] Proximal Constrained Policy Optimization (PCPO)
[ICLR 2019] Reward Constrained Policy Optimization (RCPO)

More details can be refer to On Policy Experiment.

Off-Policy

Supported Algorithms

More details can be refer to Off Policy Experiment.

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
grid		grid
model-based		model-based
off-policy		off-policy
offline		offline
on-policy		on-policy
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OmniSafe's Mujoco Velocity Benchmark on SafeRL algorithms

On-Policy

Supported Algorithms

Off-Policy

Supported Algorithms

About

Releases

Packages

Contributors 2

Gaiejj/omnisafe_benchmarks_cruve

Folders and files

Latest commit

History

Repository files navigation

OmniSafe's Mujoco Velocity Benchmark on SafeRL algorithms

On-Policy

Supported Algorithms

Off-Policy

Supported Algorithms

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Packages