Skill工具集

全部技能分类浏览

← 返回

开发者工具

Whisper Transcriber

Offline speech-to-text (ASR) using whisper.cpp (whisper-cli) + ffmpeg. Supports batch transcription, timestamps, SRT/TXT/JSON outputs, and model download. Cr...

使用 whisper.cpp (whisper-cli) + ffmpeg 的离线语音识别 (ASR)。支持批量转录、时间戳、SRT/TXT/JSON 输出及模型下载。

vvusu

开发者工具 clawhub v1.0.0 1 版本 99852.9 Key: 无需

★ 1

Stars

📥 659

下载

💾 37

安装

1

版本

#latest

概述

🎤 Whisper Transcriber（离线语音转文字）

基于 whisper.cpp / whisper-cli 的离线语音识别技能。

快速使用

安装依赖（跨平台自动检测）：

bash <SKILL_DIR>/scripts/install.sh

转写一个音频文件：

bash <SKILL_DIR>/scripts/transcribe.sh voice.ogg

批量转写目录 + 输出 SRT：

bash <SKILL_DIR>/scripts/transcribe.sh ./recordings -b -s

跨平台说明（Windows 推荐 WSL2）

macOS / Linux：使用 scripts/install.sh
Windows：推荐 WSL2（Ubuntu），在 WSL 内按 Linux 方式运行本 skill（最稳）

WSL 内安装/使用：

bash <SKILL_DIR>/scripts/install.sh
bash <SKILL_DIR>/scripts/transcribe.sh voice.ogg

> 说明：原生 Windows 环境下 whisper-cli 的安装来源/包名不统一，公开发布时容易造成安装失败；因此本 skill 默认建议 WSL2。

可配置项（环境变量）

无需改脚本，直接用环境变量覆盖默认值：

WHISPER_DEFAULT_MODEL（默认 base）
WHISPER_DEFAULT_LANG（默认 zh）
WHISPER_MODEL_DIR（默认 /assets/models）
WHISPER_MODEL_DIR_USER（默认同 WHISPER_MODEL_DIR，自动下载的默认目录；如你想把模型放到别处再覆盖此变量）
WHISPER_TEMP_DIR（默认 ${TMPDIR:-/tmp}；每次运行会在其下 mktemp 创建独立临时目录并自动清理）

目录结构

scripts/transcribe.sh：主转写脚本（支持批量、SRT/TXT/JSON）
scripts/install.sh：跨平台安装依赖 + 可选下载模型
scripts/install.ps1：Windows（非 WSL）best-effort 安装/下载（不作为默认推荐路径）
assets/models/：模型默认下载/存放位置（仓库通过 .gitignore 忽略大模型文件，避免提交/发布）
config.json：默认配置（发布/维护用，脚本通过环境变量覆盖即可）

> 需要更细的用法/参数说明：直接运行 bash /scripts/transcribe.sh --help。

版本历史

共 1 个版本

v1.0.0 当前

2026-03-29 18:46 安全安全

安全检测

腾讯云安全 (Keen)

安全，无风险

查看报告

腾讯云安全 (Sanbu)

安全，无风险

查看报告

🔗 相关推荐

ai-intelligence

Team Dispatch

vvusu

适用于需要多智能体工作流编排（任务分解 + 依赖/DAG + 并行执行）且需要跨……的持久任务追踪的场景。

★ 1 📥 932

developer-tools

CodeConductor.ai

larsonreever

AI驱动平台，提供快速全栈开发、智能体、工作流自动化及低代码AI集成的可扩展产品创建。

★ 67 📥 180,039

developer-tools

Gog

steipete

Google Workspace 命令行工具，支持 Gmail、日历、云端硬盘、通讯录、表格和文档。

★ 921 📥 185,771