开发AI玩具和语音伴侣设备，常常需要集成多种模型、音频处理和网络通信，硬件兼容性差、部署复杂，调试起来异常麻烦

4 days ago

开发AI玩具和语音伴侣设备，常常需要集成多种模型、音频处理和网络通信，硬件兼容性差、部署复杂，调试起来异常麻烦。

ElatoAI 把实时语音AI的全栈功能整合到ESP32上，支持100+模型的端到端语音交互解决方案。

不仅兼容OpenAI Realtime API、Gemini Live、xAI Grok、ElevenLabs和Hume AI EVI，还提供安全WebSocket、边缘函数部署、全球低延迟对话，甚至支持本地LLM和OTA更新。

主要功能：

- 实时语音转语音，支持OpenAI、Gemini、xAI Grok、ElevenLabs、Hume AI等多模型；
- 安全WebSocket和Opus音频压缩，实现<2s全球低延迟对话；
- 自定义AI代理，支持个性化声音、音调调节和工具调用；
- ESP32固件，支持按钮/触摸控制、WiFi配置、OTA更新，无需PSRAM；
- Next.js前端+Supabase后端，提供设备管理和对话历史；
- 边缘部署，支持Deno Edge/Cloudflare Workers，全球20分钟不间断对话。

支持Arduino IDE/PlatformIO开发，Web/移动端控制，适合AI玩具、语音助手和IoT设备开发者。