← 返回
未分类 中文

openclaw-whisper-voice

Local Whisper speech-to-text for audio files and inbound voice notes on the OpenClaw Gateway host. Use when setting up local transcription for WhatsApp, Tele...
针对 OpenClaw Gateway 主机上的音频文件及接收语音笔记,提供本地 Whisper 语音转文字功能。适用于为 WhatsApp、Tele... 配置本地转录。
sabyaghosh sabyaghosh 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 514
下载
💾 10
安装
1
版本
#latest

概述

OpenClaw Whisper Voice

Use this skill to make local Whisper transcription dependable on the OpenClaw Gateway host.

Install on the host

Run:

{baseDir}/scripts/install_local_whisper.sh

The installer:

  • installs Python packages into ~/.local
  • installs a CPU-safe PyTorch build
  • installs openai-whisper
  • installs imageio-ffmpeg
  • creates stable ~/.local/bin/whisper and ~/.local/bin/ffmpeg launchers

Transcribe a file manually

Use the wrapper instead of raw whisper when reliability matters:

{baseDir}/scripts/transcribe.sh /path/to/audio.ogg
{baseDir}/scripts/transcribe.sh /path/to/audio.m4a --model tiny --stdout-only
{baseDir}/scripts/transcribe.sh /path/to/audio.mp3 --task translate --format srt

Configure inbound WhatsApp and Telegram voice notes

Patch OpenClaw config so inbound audio uses the wrapper:

{
  tools: {
    media: {
      audio: {
        enabled: true,
        maxBytes: 20971520,
        timeoutSeconds: 120,
        models: [
          {
            type: "cli",
            command: "{baseDir}/scripts/transcribe.sh",
            args: ["{{MediaPath}}", "--model", "base", "--stdout-only"],
            timeoutSeconds: 120
          }
        ]
      }
    }
  }
}

Model choices

  • tiny: fastest, weakest accuracy
  • base: best default for chat voice notes
  • small or larger: better accuracy, heavier CPU and RAM use

Output rules

  • Use --stdout-only for tools.media.audio so stdout is only transcript text.
  • Use --format txt|srt|vtt|json for standalone file transcription.
  • First model download goes into ~/.cache/whisper.

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-30 22:23 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

Openai Whisper

steipete
使用 Whisper CLI 进行本地语音转文字(无需 API 密钥)
★ 331 📥 93,816
design-media

UI/UX Pro Max

xobi667
提供 UI/UX 设计智能与实现指导,帮助打造精美界面。适用于 UI 设计、UX 流程、信息架构、视觉风格、设计系统/标记、组件规格、文案/微文案、无障碍及前端 UI(HTML/CSS/JS、React、Next.js、Vue、Svelte
★ 217 📥 47,624
design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 430 📥 116,953