Skip to main content

开发AI玩具和语音伴侣设备,常常需要集成多种模型、音频处理和网络通信,硬件兼容性差、部署复杂,调试起来异常麻烦

  1. 开发AI玩具和语音伴侣设备,常常需要集成多种模型、音频处理和网络通信,硬件兼容性差、部署复杂,调试起来异常麻烦。

    ElatoAI 把实时语音AI的全栈功能整合到ESP32上,支持100+模型的端到端语音交互解决方案。

    不仅兼容OpenAI Realtime API、Gemini Live、xAI Grok、ElevenLabs和Hume AI EVI,还提供安全WebSocket、边缘函数部署、全球低延迟对话,甚至支持本地LLM和OTA更新。

    主要功能:

    - 实时语音转语音,支持OpenAI、Gemini、xAI Grok、ElevenLabs、Hume AI等多模型;
    - 安全WebSocket和Opus音频压缩,实现<2s全球低延迟对话;
    - 自定义AI代理,支持个性化声音、音调调节和工具调用;
    - ESP32固件,支持按钮/触摸控制、WiFi配置、OTA更新,无需PSRAM;
    - Next.js前端+Supabase后端,提供设备管理和对话历史;
    - 边缘部署,支持Deno Edge/Cloudflare Workers,全球20分钟不间断对话。

    支持Arduino IDE/PlatformIO开发,Web/移动端控制,适合AI玩具、语音助手和IoT设备开发者。