VITA-Audio:一款高效的语音语言模型,能够快速生成音频和文本内容。

低延迟,首次音频生成时间从236毫秒缩短到53毫秒;推理速度提升3-5倍;开源数据训练,包含20万小时音频
 
 
Back to Top