Search Results for author: Jianhang Huang

Found 1 papers, 0 papers with code

Policy Optimization with Stochastic Mirror Descent

no code implementations • 25 Jun 2019 • Long Yang, Yu Zhang, Gang Zheng, Qian Zheng, Pengfei Li, Jianhang Huang, Jun Wen, Gang Pan

Improving sample efficiency has been a longstanding goal in reinforcement learning.

Continuous Control Policy Gradient Methods +2

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.