黑洞资源笔记
15:17 · Mar 17, 2025 · Mon
HaploVLM
:腾讯推出的单Transformer架构多模态理解基础模型,为文本、图像和视频输入提供全面的跨模态理解能力。
统一架构,支持多模态输入和自回归响应生成;高效训练,优化训练配方,降低资源消耗;支持Ascend NPU和GPU环境,灵活适配多种硬件
Home
Powered by
BroadcastChannel
&
Sepia