FlashPortrait 是一个开源的人像动画生成项目,基于视频扩散 Transformer 技术,实现了高质量、无限长度且极速的动画合成方案。
该项目不仅能精准保持人物的身份特征,还通过自适应潜空间预测技术将推理速度提升了 6 倍,无需任何额外的后处理工具即可输出高保真结果。
主要功能:
- 身份特征保持,无需 FaceFusion 或 GFP-GAN 等工具即可生成一致性极高的面部动画;
- 支持生成无限长度的视频,采用动态滑动窗口方案确保长视频的平滑过渡;
- 极速推理性能,通过高阶潜空间导数预测跳过部分去噪步骤,实现 6 倍加速;
- 归一化面部表情模块,有效对齐表情特征与扩散潜空间,提升表情建模的稳定性;
- 多分辨率支持,涵盖从 512x512 到 1280x720 的多种横竖屏比例;
- 灵活的显存优化,提供多种显存加载模式,最低 10GB 显存即可运行。
项目基于 PyTorch 开发,提供了完整的推理、训练及微调代码,并兼容 Wan2.1 模型权重,适合研究人员和内容创作者用于开发高质量的数字人或动画工具。