Search Results for author: Alex Ahern

Found 1 papers, 0 papers with code

Reinforced Self-Training (ReST) for Language Modeling

no code implementations • 17 Aug 2023 • Caglar Gulcehre, Tom Le Paine, Srivatsan Srinivasan, Ksenia Konyushkova, Lotte Weerts, Abhishek Sharma, Aditya Siddhant, Alex Ahern, Miaosen Wang, Chenjie Gu, Wolfgang Macherey, Arnaud Doucet, Orhan Firat, Nando de Freitas

Reinforcement learning from human feedback (RLHF) can improve the quality of large language model's (LLM) outputs by aligning them with human preferences.

Language Modelling Machine Translation +4

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.