16:09 · May 18, 2023 · Thu RL4F是一个多智能体协作框架,通过增强的批评生成器,通过最大化端到端任务性能来指导GPT-3模型修正输出,展现出良好的效果和扩展性。论文地址 | #框架