DAX:专为扩散模型设计的高性能推理加速引擎,显著提升视频生成效率。
• 支持多种量化技术,包括线性层 FP8/INT8 量化及 SageAttention2 注意力量化,确保推理速度与精度兼顾。
• 精细调优的序列并行,利用通信重叠最大化资源利用率,减少等待时间。
• Teacache 技术加速 DiT 模型推理,跳过无效去噪步骤,进一步提升效率。
• 集成 torch.compile,实现量化与通信操作融合,释放硬件性能潜力。
• 兼容多种注意力后端(FLASH_ATTN、SageAttention 等),针对 Wan2.1 T2V 14B 等大模型优化。
• 开源 Apache-2.0 许可,易于安装和集成,支持本地快速部署和多卡分布式运行。
DAX 通过系统性优化与多维度加速手段,助力扩散模型推理进入更高效的阶段,适合需要快速生成高质量视频内容的研发与应用场景。