DAX：专为扩散模型设计的高性能推理加速引擎，显著提升视频生成效率

DAX：专为扩散模型设计的高性能推理加速引擎，显著提升视频生成效率。

• 支持多种量化技术，包括线性层 FP8/INT8 量化及 SageAttention2 注意力量化，确保推理速度与精度兼顾。
• 精细调优的序列并行，利用通信重叠最大化资源利用率，减少等待时间。
• Teacache 技术加速 DiT 模型推理，跳过无效去噪步骤，进一步提升效率。
• 集成 torch.compile，实现量化与通信操作融合，释放硬件性能潜力。
• 兼容多种注意力后端（FLASH_ATTN、SageAttention 等），针对 Wan2.1 T2V 14B 等大模型优化。
• 开源 Apache-2.0 许可，易于安装和集成，支持本地快速部署和多卡分布式运行。

DAX 通过系统性优化与多维度加速手段，助力扩散模型推理进入更高效的阶段，适合需要快速生成高质量视频内容的研发与应用场景。