语音通话(插件)
通过插件为 OpenClaw 提供语音通话功能,支持外呼通知以及基于入站策略的多轮对话。 当前提供商:twilio(可编程语音 + 媒体流)- INLINE_CODE_10(呼叫控制 v2)
plivo(语音 API + XML 转移 + GetInput 语音)mock(开发/无网络)
- 安装插件
- 重启网关
- 在
plugins.entries.voice-call.config下进行配置 - 使用
openclaw voicecall ...或voice_call工具
运行位置(本地与远程)
语音通话插件在网关进程内部运行。 如果使用远程网关,请在运行网关的机器上安装并配置插件,然后重启网关以加载插件。安装
选项 A:通过 npm 安装(推荐)
选项B:从本地文件夹安装(开发,无需复制)
配置
在plugins.entries.voice-call.config 下设置配置:
- Twilio/Telnyx 需要一个可公开访问的 Webhook URL。
- Plivo 需要一个可公开访问的 Webhook URL。
mock是一个本地开发提供商(无需网络调用)。skipSignatureVerification仅用于本地测试。- 如果您使用 ngrok 免费层级,请将
publicUrl设置为确切的 ngrok URL;签名验证始终强制执行。 tunnel.allowNgrokFreeTierLoopbackBypass: true仅在tunnel.provider="ngrok"和serve.bind使用环回(ngrok 本地代理)时,允许带有无效签名的 Twilio Webhook。仅供本地开发使用。- Ngrok 免费层级的 URL 可能会变化或引入插页式行为;如果
publicUrl发生漂移,Twilio 签名将失败。对于生产环境,建议使用稳定的域名或 Tailscale 漏斗。
用于通话的TTS
语音通话使用核心messages.tts 配置(OpenAI 或 ElevenLabs)在通话中进行流式语音输出。您可以在插件配置中以相同结构覆盖该配置——它会与 messages.tts 进行深度合并。
- 在语音通话中,边缘TTS会被忽略(电信音频需要PCM;边缘输出不可靠)。
- 启用Twilio媒体流时使用核心TTS;否则,通话将回退到提供商的原生语音。
更多示例
仅使用核心TTS(不覆盖):disabled。要启用入站通话,请设置:
responseModelresponseSystemPromptresponseTimeoutMs
命令行界面
代理工具
工具名称:voice_call
操作:
initiate_call(消息,收件人?,模式?)continue_call(通话 ID,消息)speak_to_user(通话 ID,消息)end_call(通话 ID)get_status(通话 ID)
skills/voice-call/SKILL.md。
网关 RPC
voicecall.initiate(to?、message、mode?)voicecall.continue(callId、message)voicecall.speak(callId、message)voicecall.end(callId)voicecall.status(callId)