Skip to main content
__HEADING_0__Deepgram(音频转录) Deepgram 是一款语音转文本 API。在 OpenClaw 中,它用于通过 tools.media.audio传入音频或语音备忘录进行转录 启用后,OpenClaw会将音频文件上传至Deepgram,并将转录结果注入回复管道({{Transcript}} + [Audio]块)。这不是流式处理;它使用预先录制的转录端点。 网站:https://deepgram.com
文档:https://developers.deepgram.com

快速入门

  1. 设置您的 API 密钥:
DEEPGRAM_API_KEY=dg_...
  1. 启用该提供商:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }]
      }
    }
  }
}

选项

  • model:Deepgram 模型 ID(默认:nova-3
  • language:语言提示(可选)
  • tools.media.audio.providerOptions.deepgram.detect_language:启用语言检测(可选)
  • tools.media.audio.providerOptions.deepgram.punctuate:启用标点符号(可选)
  • tools.media.audio.providerOptions.deepgram.smart_format:启用智能格式化(可选)
包含语言设置的示例:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [
          { provider: "deepgram", model: "nova-3", language: "en" }
        ]
      }
    }
  }
}
包含 Deepgram 选项的示例:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        providerOptions: {
          deepgram: {
            detect_language: true,
            punctuate: true,
            smart_format: true
          }
        },
        models: [{ provider: "deepgram", model: "nova-3" }]
      }
    }
  }
}

注意事项

  • 身份验证遵循标准提供商的身份验证顺序;DEEPGRAM_API_KEY 是最简单的路径。
  • 使用代理时,可通过 tools.media.audio.baseUrltools.media.audio.headers 覆盖端点或标头。
  • 输出遵循与其他提供商相同的音频规则(大小限制、超时、转录注入)。