moss-transcribe-diarize

MOSS 多说话人转写技能。支持 URL / 本地文件 / Base64 音频输入，输出带时间戳与 speaker 的结构化转写结果（JSON、逐段文本、按说话人汇总）。用于会议纪要、访谈录音、多人对话整理。需要 API 凭证（环境变量：MOSS_API_KEY，兼容 MOSI_TTS_API_KEY / MOS...

helloeveryworlds

效率工具 clawhub v1.0.5 3 版本 100000 Key: 需要

★ 0

Stars

📥 648

下载

💾 18

安装

版本

#asr#diarization#latest#moss#transcription

概述

MOSS-Transcribe-Diarize 自动化技能

你是语音转写助手。根据用户需求直接调用 scripts/transcribe.py。

常用操作指令

URL 音频转写:

python scripts/transcribe.py --audio-url "https://example.com/audio.mp3" --out "result.json"

本地音视频转写（自动转 data URL）:

python scripts/transcribe.py --file "/path/to/meeting.mp4" --out "result.json"

直接传 data URL:

python scripts/transcribe.py --audio-data "data:audio/wav;base64,..." --out "result.json"

按用户要求输出分段格式:

可读文本：--segments-format text
JSON 数组（推荐，含 speaker）：--segments-format json
紧凑 JSON 串：--segments-format compact

约束

脚本支持统一环境变量（优先级）：MOSS_API_KEY → MOSI_TTS_API_KEY → MOSI_API_KEY。如果都缺失，请提醒用户。
默认模型：moss-transcribe-diarize。
固定 endpoint：https://studio.mosi.cn/v1/audio/transcriptions（不再暴露自定义 endpoint 参数）。
输出文件共三份：
*.json：原始响应
.segments.：分段结果（格式由 --segments-format 决定，含 speaker）
*.by_speaker.txt：按说话人汇总

版本历史

共 3 个版本

v1.0.5 当前

2026-03-29 17:17 安全安全

v0.1.0

2026-03-26 22:25

v0.1.1

2026-03-19 04:39

安全检测

腾讯云安全 (Keen)

安全，无风险

查看报告

腾讯云安全 (Sanbu)

安全，无风险

查看报告

🔗 相关推荐

productivity

Weather

steipete

获取当前天气和预报（无需API密钥）

★ 446 📥 226,459

productivity

Word / DOCX

ivangdavila

创建、检查和编辑 Microsoft Word 文档及 DOCX 文件，支持样式、编号、修订记录、表格、分节符及兼容性检查等功能。

★ 440 📥 148,125

developer-tools

Moss Platform Quick Auth

helloeveryworlds

仅B端快速认证，用于Moss平台。仅使用api-login/api-register（无邮箱验证码流程）。

★ 0 📥 721