Miipher-2:基于HuBERT与Parallel Adapter的高质量语音增强开源实现,兼具轻量与高效,适用于多语言场景。

• 采用多语言HuBERT(mHuBERT-147)作为特征提取骨干,支持强鲁棒性语音表示
• 创新Parallel Adapter设计,轻量级模块灵活插入,提升特征适应性与模型效率
• 集成HiFi-GAN vocoder,保证增强语音自然且高保真
• 完整训练流程覆盖数据预处理(支持JVS/LibriTTS/FLEURS多语料)、Adapter训练及SSL-Vocoder训练
• 多指标综合评估体系(PESQ、STOI、SI-SDR、MOS-LQO)确保增强效果科学量化
• 开箱即用的预训练模型,快速实现语音降噪与质量提升,适配多种噪声环境
• Hydra配置管理,支持灵活定制训练与推理流程,结构清晰便于扩展维护
• 详尽代码与文档,支持社区二次开发和模型微调,助力科研与工业应用

Miipher-2不仅提升语音清晰度,更强调模型轻量与多语言泛化能力,适合追求高效与效果平衡的语音增强需求。
 
 
Back to Top