MMR1:多模态推理的前沿探索,用极少量数据实现顶尖性能。

仅用6k公开数据训练,达到开源7B多模态模型的SOTA性能;6小时内完成高效训练,性价比超高;数据平衡策略,覆盖多样数学问题类型
 
 
Back to Top