Skip to main content

专为大型语言模型提供高级推理能力的开源框架,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题,提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型,并且支持多种推理和训练方法OpenR | #框架

  1. 专为大型语言模型提供高级推理能力的开源框架,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题,提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型,并且支持多种推理和训练方法

    OpenR | #框架