制作人像动画时,长视频往往难以维持人物身份特征的一致性,且生成速度缓慢,通常需要复杂的面部修复或换脸工具进行后期处理。

FlashPortrait 是一个开源的人像动画生成项目,基于视频扩散 Transformer 技术,实现了高质量、无限长度且极速的动画合成方案。

该项目不仅能精准保持人物的身份特征,还通过自适应潜空间预测技术将推理速度提升了 6 倍,无需任何额外的后处理工具即可输出高保真结果。

主要功能:

- 身份特征保持,无需 FaceFusion 或 GFP-GAN 等工具即可生成一致性极高的面部动画;
- 支持生成无限长度的视频,采用动态滑动窗口方案确保长视频的平滑过渡;
- 极速推理性能,通过高阶潜空间导数预测跳过部分去噪步骤,实现 6 倍加速;
- 归一化面部表情模块,有效对齐表情特征与扩散潜空间,提升表情建模的稳定性;
- 多分辨率支持,涵盖从 512x512 到 1280x720 的多种横竖屏比例;
- 灵活的显存优化,提供多种显存加载模式,最低 10GB 显存即可运行。

项目基于 PyTorch 开发,提供了完整的推理、训练及微调代码,并兼容 Wan2.1 模型权重,适合研究人员和内容创作者用于开发高质量的数字人或动画工具。
 
 
Back to Top