← 返回
未分类 Key

Fun-ASR speech recognition

阿里云百炼 FunASR 录音文件识别,使用阿里云 DashScope API 进行语音转文字。当用户需要转录音频文件时触发。
阿里云百炼 FunASR 录音文件识别,利用 DashScope API 将语音转为文字;当用户需要转录音频时触发。
pengzhendong pengzhendong 来源
未分类 clawhub v1.0.0 1 版本 99825.5 Key: 需要
★ 0
Stars
📥 572
下载
💾 2
安装
1
版本
#latest

概述

Fun-ASR

Fun-ASR 是通义实验室百聆团队推出的端到端语音识别大模型,是基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性。

激活条件

触发场景说明
----------------
用户发送音频文件.wav / .mp3 / .m4a / .flac / .ogg 等格式
用户要求转录"转写音频"、"语音转文字"
音频文件处理需要提取音频中的文字内容

配置

设置环境变量:

export DASHSCOPE_API_KEY="sk-xxx"

使用方法

安装依赖

pip install dashscope librosa

转写音频文件

python scripts/cli.py audio.wav

版本:1.0.0

创建于:2026-03-16

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-02 04:36 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

Openai Whisper

steipete
使用 Whisper CLI 进行本地语音转文字(无需 API 密钥)
★ 330 📥 93,293
dev-programming

DashScope LLM

pengzhendong
通过阿里云 DashScope 的 OpenAI 兼容 API 发送简单单轮对话请求,用于快速 LLM 测试、提示词实验或一次性文本生成。
★ 0 📥 363
design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 427 📥 116,437