语音应用开发常常面临模型延迟高、质量难兼顾的问题。

Liquid Audio 是 Liquid AI 推出的开源端到端语音基础模型,专为实时语音转语音设计,轻量级的 LFM2 模型支持低延迟且高质量的语音交互。

它提供两种生成模式:
- 交错模式(interleaved),适合实时对话,边说边生成文本和音频;
- 顺序模式(sequential),适用语音识别(ASR)和文本转语音(TTS)等非对话任务。

功能亮点:
- 实时语音转语音对话,流畅自然;
- 支持多轮多模态交互,文本与音频无缝切换;
- 方便集成,pip 安装即可上手;
- 附带 Gradio 演示,轻松体验模型能力。

适合开发智能助理、语音机器人、会议转写、语音合成等应用。

快速安装:
pip install liquid-audio
pip install "liquid-audio[demo]"


用 Liquid Audio,轻松打造自然流畅的语音交互体验。
 
 
Back to Top