Dueling DQN Experiment Repository

Google DeepMind 팀이 발표한 Dueling DQN을 실습해봅시다.

1. Corridor Experiment Plot Result

Conclusion
- 수렴 속도 측면에서 Dueling stream의 위력을 관찰할 수 있음.
- 본 실험에서의 Single stream는 논문의 Single stream 보다 퍼포먼스가 안 좋음.
- 반대로, 본 실험에서의 Dueling stream은 논문의 Dueling stream보다 더 좋은 퍼포먼스를 보임.
Note
- epsilon값을 논문과 달리 0.01로 설정하였음.

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
Corridor Environment Policy Evaluation.ipynb		Corridor Environment Policy Evaluation.ipynb
README.md		README.md