Awesome-Video-LMM-Post-Training 是一个系统汇总最新 Video-LMM 后训练技术的开源仓库,涵盖强化学习调优、多模态微调、推理能力提升和推理基准等前沿研究。
它不仅收录了大量高质量论文、代码和数据集,还重点关注如何通过后训练加强视频大模型的推理能力,实现更精准复杂的视频内容理解。
主要亮点:
- 强化学习(RLHF、DPO、GRPO等)驱动的视频模型推理优化
- 面向视频推理的监督微调(SFT)方法与数据
- 测试时推理能力扩展技术,提升长视频理解效率
- 专门设计的复杂视频推理基准和评测体系
适合视频理解、视觉语言模型、多模态AI研究者和开发者深入学习参考。