语音应用开发常常面临模型延迟高、质量难兼顾的问题

语音应用开发常常面临模型延迟高、质量难兼顾的问题。

Liquid Audio 是 Liquid AI 推出的开源端到端语音基础模型，专为实时语音转语音设计，轻量级的 LFM2 模型支持低延迟且高质量的语音交互。

它提供两种生成模式：
- 交错模式（interleaved），适合实时对话，边说边生成文本和音频；
- 顺序模式（sequential），适用语音识别（ASR）和文本转语音（TTS）等非对话任务。

功能亮点：
- 实时语音转语音对话，流畅自然；
- 支持多轮多模态交互，文本与音频无缝切换；
- 方便集成，pip 安装即可上手；
- 附带 Gradio 演示，轻松体验模型能力。

适合开发智能助理、语音机器人、会议转写、语音合成等应用。

快速安装：

pip install liquid-audio
pip install "liquid-audio[demo]"

用 Liquid Audio，轻松打造自然流畅的语音交互体验。