MiniMax 文字转语音 Skill,支持中文音色选择、情绪检测、停顿标记。
生成语音并发送到飞书,支持自动情绪检测和停顿标记。
tts_wrapper.sh tts "<文本>" [voice_id] [user_open_id]
通过描述创建自定义音色。
tts_wrapper.sh design "<音色描述>" "<试听文本>" "<要说的内容>"
tts_wrapper.sh list
从 API 获取最新音色并更新本地 voices-map.md。
tts_wrapper.sh update
在飞书对话中输入 "转语音" 即可触发。
转语音 → 将我最近一条消息转成语音转语音 → 将那条消息转成语音系统会根据文本关键词自动判断情绪,并在 API 参数中使用:
| 情绪 | 关键词示例 |
|---|---|
| ------ | ---------- |
| happy | 开心、高兴、太好了、哈哈、太棒了 |
| sad | 伤心、难过、遗憾、可惜、唉 |
| angry | 生气、气死了、讨厌、哼 |
| fearful | 害怕、担心、恐怖 |
| disgusted | 恶心、厌恶 |
| surprised | 惊讶、吃惊、没想到 |
| calm | 平静、淡定、好吧 |
文本会自动在标点后插入停顿标记,提升语音自然度:
, → 0.3秒停顿。 → 0.5秒停顿? → 0.5秒停顿! → 0.5秒停顿示例:
真的吗?太好了!哈哈哈!真的吗?<#0.5#>太好了!<#0.5#>哈哈哈!<#0.5#>如需强制指定情绪,可传入 emotion 参数覆盖自动检测。
| 变量 | 说明 |
|---|---|
| ------ | ------ |
MINIMAX_API_KEY | MiniMax API Key |
FEISHU_APP_ID | 飞书 App ID |
FEISHU_APP_SECRET | 飞书 App Secret |
skills/minimax-tts/
├── SKILL.md
├── index.js
└── scripts/
├── tts.py # 核心 TTS 功能
├── voice_design.py # 音色设计
├── list_voices.py # 查询音色列表
├── update_voices_map.py # 更新音色目录
├── text_preprocessor.py # 文本预处理(情绪+停顿)
├── tts_from_chat.py # 对话式转语音
└── tts_wrapper.sh # 统一入口
Chinese (Mandarin)_Gentle_Senior(温柔学姐) - 温柔、知性、略带亲切感的声音
共 1 个版本