HaploVLM:腾讯推出的单Transformer架构多模态理解基础模型,为文本、图像和视频输入提供全面的跨模态理解能力。

统一架构,支持多模态输入和自回归响应生成;高效训练,优化训练配方,降低资源消耗;支持Ascend NPU和GPU环境,灵活适配多种硬件
 
 
Back to Top