generalized-advantage-estimation

Here are 4 public repositories matching this topic...

adik993 / ppo-pytorch

Proximal Policy Optimization(PPO) with Intrinsic Curiosity Module(ICM)

reinforcement-learning deep-learning pytorch icm proximal-policy-optimization ppo mountaincar-v0 cartpole-v1 intrinsic-curiosity-module generalized-advantage-estimation pendulum-v0

Updated Jan 12, 2019
Python

hcnoh / rl-collection-pytorch

Star

A collection of Reinforcement Learning implementations with PyTorch

reinforcement-learning deep-learning gae deep-reinforcement-learning openai-gym pytorch policy-gradient continuous-control actor-critic trpo trust-region-policy-optimization proximal-policy-optimization ppo generalized-advantage-estimation

Updated Mar 22, 2022
Python

leaderj1001 / Phasic-Policy-Gradient

Star

Phasic-Policy-Gradient

policy-gradient proximal-policy-optimization generalized-advantage-estimation phasic-policy-gradient

Updated Dec 1, 2020
Python

tomasspangelo / proximal-policy-optimization

Star

An implementation from the state-of-the-art family of reinforcement learning algorithms Proximal Policy Optimization using normalized Generalized Advantage Estimation and optional batch mode training. The loss function incorporates an entropy bonus.

python machine-learning reinforcement-learning entropy deep-learning neural-network optimization gae pytorch rl actor-critic proximal-policy-optimization ppo open-ai open-ai-gym generalized-advantage-estimation ppo-pytorch

Updated Dec 26, 2022
Python

Improve this page

Add a description, image, and links to the generalized-advantage-estimation topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the generalized-advantage-estimation topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

generalized-advantage-estimation

Here are 4 public repositories matching this topic...

adik993 / ppo-pytorch

hcnoh / rl-collection-pytorch

leaderj1001 / Phasic-Policy-Gradient

tomasspangelo / proximal-policy-optimization

Improve this page

Add this topic to your repo