Search Results for author: Andras Antos

Found 1 papers, 0 papers with code

Online Markov Decision Processes under Bandit Feedback

no code implementations • NeurIPS 2010 • Gergely Neu, Andras Antos, András György, Csaba Szepesvári

We consider online learning in finite stochastic Markovian environments where in each time step a new reward function is chosen by an oblivious adversary.

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.