开发AI玩具和语音伴侣设备,常常需要集成多种模型、音频处理和网络通信,硬件兼容性差、部署复杂,调试起来异常麻烦。
ElatoAI 把实时语音AI的全栈功能整合到ESP32上,支持100+模型的端到端语音交互解决方案。
不仅兼容OpenAI Realtime API、Gemini Live、xAI Grok、ElevenLabs和Hume AI EVI,还提供安全WebSocket、边缘函数部署、全球低延迟对话,甚至支持本地LLM和OTA更新。
GitHub:github.com/akdeb/ElatoAI
主要功能:
- 实时语音转语音,支持OpenAI、Gemini、xAI Grok、ElevenLabs、Hume AI等多模型;- 安全WebSocket和Opus音频压缩,实现