node scripts/xiaomi-tts.js "你好世界" --voice default_zh --style "夹子音" --output output.wav
需要设置 MIMO_API_KEY 环境变量,或通过 --api-key 参数传入。
| 音色 | voice 参数 |
|---|---|
| ------ | ----------- |
| MiMo 默认 | mimo_default |
| 中文女声(默认) | default_zh |
| 英文女声 | default_eh |
在文本开头用 标签指定风格,支持叠加:
歌词内容在文本中用中文括号标注情绪、动作等:
(紧张,深呼吸)呼……冷静,冷静
(语速加快,碎碎念)怎么办怎么办
(小声)哎呀,领带歪没歪?
(提高音量喊话)大姐!这鱼新鲜着呢!
assistant 角色消息中 标签必须在文本最前面共 1 个版本