Search Results for author: Zuofan Wu

Found 1 papers, 0 papers with code

Off-Policy Reinforcement Learning with Delayed Rewards

no code implementations • 22 Jun 2021 • Beining Han, Zhizhou Ren, Zuofan Wu, Yuan Zhou, Jian Peng

We study deep reinforcement learning (RL) algorithms with delayed rewards.

reinforcement-learning Reinforcement Learning (RL)

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.