← 返回
效率工具 Key

moss-transcribe-diarize

MOSS 多说话人转写技能。支持 URL / 本地文件 / Base64 音频输入,输出带时间戳与 speaker 的结构化转写结果(JSON、逐段文本、按说话人汇总)。用于会议纪要、访谈录音、多人对话整理。需要 API 凭证(环境变量:MOSS_API_KEY,兼容 MOSI_TTS_API_KEY / MOS...
MOSS 多说话人转写技能。支持 URL / 本地文件 / Base64 音频输入,输出带时间戳与 speaker 的结构化转写结果(JSON、逐段文本、按说话人汇总)。用于会议纪要、访谈录音、多人对话整理。需要 API 凭证(环境变量:MOSS_API_KEY,兼容 MOSI_TTS_API_KEY / MOS...
helloeveryworlds
效率工具 clawhub v1.0.5 3 版本 100000 Key: 需要
★ 0
Stars
📥 648
下载
💾 18
安装
3
版本
#asr#diarization#latest#moss#transcription

概述

MOSS-Transcribe-Diarize 自动化技能

你是语音转写助手。根据用户需求直接调用 scripts/transcribe.py

常用操作指令

  1. URL 音频转写:

python scripts/transcribe.py --audio-url "https://example.com/audio.mp3" --out "result.json"

  1. 本地音视频转写(自动转 data URL):

python scripts/transcribe.py --file "/path/to/meeting.mp4" --out "result.json"

  1. 直接传 data URL:

python scripts/transcribe.py --audio-data "data:audio/wav;base64,..." --out "result.json"

  1. 按用户要求输出分段格式:
    • 可读文本:--segments-format text
    • JSON 数组(推荐,含 speaker):--segments-format json
    • 紧凑 JSON 串:--segments-format compact

约束

  • 脚本支持统一环境变量(优先级):MOSS_API_KEYMOSI_TTS_API_KEYMOSI_API_KEY。如果都缺失,请提醒用户。
  • 默认模型:moss-transcribe-diarize
  • 固定 endpoint:https://studio.mosi.cn/v1/audio/transcriptions(不再暴露自定义 endpoint 参数)。
  • 输出文件共三份:
  • *.json:原始响应
  • .segments.:分段结果(格式由 --segments-format 决定,含 speaker)
  • *.by_speaker.txt:按说话人汇总

版本历史

共 3 个版本

  • v1.0.5 当前
    2026-03-29 17:17 安全 安全
  • v0.1.0
    2026-03-26 22:25
  • v0.1.1
    2026-03-19 04:39

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

productivity

Weather

steipete
获取当前天气和预报(无需API密钥)
★ 446 📥 226,459
productivity

Word / DOCX

ivangdavila
创建、检查和编辑 Microsoft Word 文档及 DOCX 文件,支持样式、编号、修订记录、表格、分节符及兼容性检查等功能。
★ 440 📥 148,125
developer-tools

Moss Platform Quick Auth

helloeveryworlds
仅B端快速认证,用于Moss平台。仅使用api-login/api-register(无邮箱验证码流程)。
★ 0 📥 721