← 返回
未分类

Qwen ASR (C-based Offline)

Offline Chinese and mixed Chinese-English speech-to-text recognition in pure C without Python or FFmpeg dependencies, suitable for edge devices.
离线中文及中英混合语音转文字识别,纯C实现,无需Python或FFmpeg依赖,适用于边缘设备。
rightister
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 504
下载
💾 0
安装
1
版本
#ai#asr#c#latest#offline#speech

概述

qwen-asr — 离线中文语音识别(纯 C 实现)

使用 antirez/qwen-asrqwen3-asr-0.6b 模型进行中文语音转文字,无 Python/GIL/FFmpeg 依赖,适合边缘部署。


依赖

平台依赖项说明
--------------------
macOSAccelerate.framework系统自带,自动链接
LinuxOpenBLAS 或 Intel MKL需手动安装

典型用法

# 转写音频(自动预处理为 16kHz/mono/WAV)
.skill qwen-asr --audio /path/to/audio.wav

# 指定模型(small=0.6B, large=1.7B)
.skill qwen-asr --audio /path/to/audio.wav --model large

# 指定线程数
.skill qwen-asr --audio /path/to/audio.wav --threads 4

输出

[中文] 现在已经可以用了吗?

支持中/英文混读(模型训练语料含双语)。


模型大小

模型大小推荐场景
----------------------
qwen3-asr-0.6b~1.7GB推荐:低延迟、边缘设备
qwen3-asr-1.7b~4.5GB高精度(需 ≥4GB 内存)

注意事项

  • 音频必须为 16kHz/mono/16-bit PCM WAV(脚本会自动转换非合规音频)
  • 首次运行会下载模型(~1.7GB),后续无需重复下载
  • 仅支持 .ogg/.mp3/.wav.wav 预处理(FFmpeg 内置支持)
  • 推理为纯离线,无需网络(模型下载阶段除外)

作者

  • GitHub: @antirez
  • 技能封装: OpenClaw Agent

许可

MIT(qwen-asr)+ 阿里云 Qwen3 ASR Model License

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-01 20:21 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

security-compliance

Skill Vetter

spclaudehome
AI智能体技能安全预审工具。安装ClawdHub、GitHub等来源技能前,检查风险信号、权限范围及可疑模式。
★ 1,215 📥 266,579
developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 668 📥 324,212
ai-intelligence

Self-Improving + Proactive Agent

ivangdavila
自我反思+自我批评+自我学习+自组织记忆。智能体评估自身工作、发现错误并持续改进。
★ 1,358 📥 318,474