RL4F是一个多智能体协作框架，通过增强的批评生成器，通过最大化端到端任务性能来指导GPT-3模型修正输出，展现出良好的效果和扩展性

16:09 · May 18, 2023 · Thu

RL4F是一个多智能体协作框架，通过增强的批评生成器，通过最大化端到端任务性能来指导GPT-3模型修正输出，展现出良好的效果和扩展性。

论文地址 | #框架