概述

Fun-ASR-Nano

Fun-ASR-Nano 基于 sherpa-onnx 引擎的本地语音识别，完全离线运行，无需网络连接。支持多种语言和方言的语音转文字。


中文包括 7 种方言（吴语、粤语、闽语、客家话、赣语、湘语、晋语）和 26 种地方口音（河南、山西、湖北、四川、重庆、云南、贵州、广东、广西 及其他 20 多个地区）。

英文和日文涵盖多种地方口音。

此外还支持歌词识别和说唱语音识别。

特点：
- 本地运行，保护隐私
- 离线识别，无需网络
- 支持多种音频格式

激活条件

触发场景	说明
----------	------
用户发送音频文件	`.wav` / `.mp3` / `.m4a` / `.flac` / `.ogg` 等格式
用户要求转录	"转写音频"、"语音转文字"
音频文件处理	需要提取音频中的文字内容

使用方法

安装依赖

pip install sherpa-onnx soundfile modelscope

转写音频文件

python scripts/cli.py audio.wav

版本：1.0.0

创建于：2026-03-18

版本历史

共 1 个版本

v1.0.0 当前

2026-05-03 10:32 安全安全

安全检测

暂无安全检测报告

Local fun-asr-nano powered by sherpa-onnx

概述

Fun-ASR-Nano

激活条件

使用方法

安装依赖

转写音频文件

版本历史

安全检测