← 返回
开发者工具

Whisper Transcriber

Offline speech-to-text (ASR) using whisper.cpp (whisper-cli) + ffmpeg. Supports batch transcription, timestamps, SRT/TXT/JSON outputs, and model download. Cr...
使用 whisper.cpp (whisper-cli) + ffmpeg 的离线语音识别 (ASR)。支持批量转录、时间戳、SRT/TXT/JSON 输出及模型下载。
vvusu
开发者工具 clawhub v1.0.0 1 版本 99852.9 Key: 无需
★ 1
Stars
📥 659
下载
💾 37
安装
1
版本
#latest

概述

🎤 Whisper Transcriber(离线语音转文字)

基于 whisper.cpp / whisper-cli 的离线语音识别技能。

快速使用

  • 安装依赖(跨平台自动检测):
bash <SKILL_DIR>/scripts/install.sh
  • 转写一个音频文件:
bash <SKILL_DIR>/scripts/transcribe.sh voice.ogg
  • 批量转写目录 + 输出 SRT:
bash <SKILL_DIR>/scripts/transcribe.sh ./recordings -b -s

跨平台说明(Windows 推荐 WSL2)

  • macOS / Linux:使用 scripts/install.sh
  • Windows:推荐 WSL2(Ubuntu),在 WSL 内按 Linux 方式运行本 skill(最稳)

WSL 内安装/使用:

bash <SKILL_DIR>/scripts/install.sh
bash <SKILL_DIR>/scripts/transcribe.sh voice.ogg

> 说明:原生 Windows 环境下 whisper-cli 的安装来源/包名不统一,公开发布时容易造成安装失败;因此本 skill 默认建议 WSL2。

可配置项(环境变量)

无需改脚本,直接用环境变量覆盖默认值:

  • WHISPER_DEFAULT_MODEL(默认 base)
  • WHISPER_DEFAULT_LANG(默认 zh)
  • WHISPER_MODEL_DIR(默认 /assets/models
  • WHISPER_MODEL_DIR_USER(默认同 WHISPER_MODEL_DIR自动下载的默认目录;如你想把模型放到别处再覆盖此变量)
  • WHISPER_TEMP_DIR(默认 ${TMPDIR:-/tmp};每次运行会在其下 mktemp 创建独立临时目录并自动清理)

目录结构

  • scripts/transcribe.sh:主转写脚本(支持批量、SRT/TXT/JSON)
  • scripts/install.sh:跨平台安装依赖 + 可选下载模型
  • scripts/install.ps1:Windows(非 WSL)best-effort 安装/下载(不作为默认推荐路径)
  • assets/models/:模型默认下载/存放位置(仓库通过 .gitignore 忽略大模型文件,避免提交/发布)
  • config.json:默认配置(发布/维护用,脚本通过环境变量覆盖即可)

> 需要更细的用法/参数说明:直接运行 bash /scripts/transcribe.sh --help

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-29 18:46 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

ai-intelligence

Team Dispatch

vvusu
适用于需要多智能体工作流编排(任务分解 + 依赖/DAG + 并行执行)且需要跨……的持久任务追踪的场景。
★ 1 📥 932
developer-tools

CodeConductor.ai

larsonreever
AI驱动平台,提供快速全栈开发、智能体、工作流自动化及低代码AI集成的可扩展产品创建。
★ 67 📥 180,039
developer-tools

Gog

steipete
Google Workspace 命令行工具,支持 Gmail、日历、云端硬盘、通讯录、表格和文档。
★ 921 📥 185,771