Implementing RLHF: Learning to Summarize with trlX

Jan 23, 2023

Implementation of Reinforcement Learning with Human Feedback for text summarization task using CarperAI’s trlX framework.