Search Results for author: Tony X Liu

Found 1 papers, 0 papers with code

Second Thoughts are Best: Learning to Re-Align With Human Values from Text Edits

no code implementations • 1 Jan 2023 • Ruibo Liu, Chenyan Jia, Ge Zhang, Ziyu Zhuang, Tony X Liu, Soroush Vosoughi

We present Second Thought, a new learning paradigm that enables language models (LMs) to re-align with human values.

reinforcement-learning Reinforcement Learning (RL) +1

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.