← 返回
效率工具

Local Speech Recognition

本地语音转文字 / Local Speech-to-Text. 使用 faster-whisper 在本地运行 Whisper 模型,无需 API 费用,完全免费。收到语音消息(.ogg .m4a .mp3)自动触发转录,支持中文/英文/日语/自动检测。| Free local STT/TTS alternati...
本地语音转文字:使用 faster‑whisper 在本地运行 Whisper 模型,完全免费、无需 API。自动转录 .ogg、.m4a、.mp3 语音文件,支持中文、英文、日语及自动语言检测。
zktufo
效率工具 clawhub v1.0.2 3 版本 100000 Key: 无需
★ 1
Stars
📥 657
下载
💾 27
安装
3
版本
#latest

概述

本地语音识别 / Local Speech Recognition

> 使用 faster-whisper 在本地运行 Whisper 模型,无需任何 API 费用。免费、离线、保护隐私。

> Runs faster-whisper locally — no API keys, no costs, fully offline & private.


功能特点 / Features

  • 🎙️ 全自动转录 — 收到语音消息自动触发,无需手动调用
  • 💰 完全免费 — 无需 API key,无任何费用
  • 🔒 隐私安全 — 所有处理在本地完成,音频不离开你的设备
  • 🌐 多语言支持 — 中文 / 英文 / 日语 / 自动检测
  • 快速响应 — VAD 静音过滤,模型内存缓存
  • 📦 主流格式 — .ogg .m4a .mp3 .wav

使用方式 / Usage

收到语音消息后,OpenClaw 自动调用转录脚本并将结果注入对话。

转录命令 / Command:

python3 ~/.openclaw/workspace/skills/speech-recognition-local/scripts/transcribe.py <audio_file> [language]

参数说明 / Parameters:

参数默认值说明
--------------------
audio_file音频文件路径 / Audio file path
languagezh语言:zh / en / ja / auto

模型说明 / Model Info

  • 默认模型 / Default: base(精度与速度平衡)
  • 首次使用自动下载 / Auto-download on first use
  • VAD 静音过滤已启用 / VAD filtering enabled
  • 模型缓存在内存中 / Model cached in memory

适用场景 / Use Cases

场景 / Scenario说明
----------------------
语音消息转文字将微信/飞书/Telegram 语音转为可阅读文本
会议记录录制音频后快速转录存档
播客字幕将音频文件批量转为文字稿
隐私敏感场景不希望音频数据上传第三方

限制 / Limitations

  • 支持格式 / Supported: .ogg .m4a .mp3 .wav
  • 文件大小 / Max size: 25MB

安装前提 / Requirements

  • Python 3.8+
  • faster-whisper(首次使用自动安装)

版本历史

共 3 个版本

  • v1.0.2 当前
    2026-05-03 04:04 安全 安全
  • v1.0.1
    2026-03-29 19:00 安全 安全
  • v1.0.0
    2026-03-26 22:19

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

productivity

Nano Pdf

steipete
使用nano-pdf CLI通过自然语言指令编辑PDF
★ 275 📥 114,887
productivity

Weather

steipete
获取当前天气和预报(无需API密钥)
★ 445 📥 226,371

Speech Recognition Local

zktufo
本地语音转文字:使用 faster‑whisper 在本地运行 Whisper 模型,完全免费、无需 API。自动转录 .ogg、.m4a、.mp3 语音文件,支持中文、英文、日语及自动语言检测。
★ 0 📥 671