← 返回
未分类

TTS Synthesizer | TTS 合成器

文字转语音(Text-to-Speech / TTS)工具。 支持 edge-tts(微软神经网络 TTS,在线合成)和 OpenAI 兼容 API TTS。 触发词:语音回复、TTS、文字转语音、语音合成、语音对话。 适用平台:Linux / Windows / macOS。
文字转语音(TTS)工具,支持 edge‑tts(微软神经网络在线合成)和 OpenAI 兼容 API TTS。触发词:语音回复、TTS、文字转语音、语音合成、语音对话。平台:Linux / Windows / macOS。
moroiser
未分类 clawhub v1.0.9 1 版本 100000 Key: 无需
★ 1
Stars
📥 583
下载
💾 1
安装
1
版本
#latest

概述

TTS Synthesizer | TTS 合成器 🔊

将文字转换为语音,支持微软神经网络 TTS(联网合成)和 OpenAI 兼容 API。

目录

  1. 概述
  2. 快速开始
  3. 脚本说明
  4. 声音列表
  5. 输出目录
  6. 环境变量
  7. 故障排查

概述

> ⚠️ 注意:OpenClaw 内置了 tts 工具,但它的输出格式(MP3/WebM)不适合直接发送飞书语音。

> 飞书语音消息必须用 tts_simple.py,它会自动输出 OGG/Opus 格式。

支持的 TTS 引擎

引擎说明优点缺点
------------------------
edge微软神经网络 TTS免费、联网合成、高音质、支持中文需访问微软服务
apiOpenAI 兼容 API质量高、可选声音多需要 API Key

edge-tts 支持的声音(完整列表)

中文(大陆):

声音风格
------------
zh-CN-XiaoxiaoNeural晓晓(女声,默认
zh-CN-YunxiNeural云希(男声)
zh-CN-YunyangNeural云扬(男声)
zh-CN-XiaoyiNeural晓伊(女声)

中文(台湾):

声音风格
------------
zh-TW-HsiaoYuNeural小宇(女声)

英文:

声音风格
------------
en-US-JennyNeural美式女声
en-US-GuyNeural美式男声
en-GB-SoniaNeural英式女声
en-GB-RyanNeural英式男声
en-AU-NatashaNeural澳式女声
en-IN-NeerjaNeural印度女声

日文:

声音风格
------------
ja-JP-NanamiNeural日语女声
ja-JP-MayuNeural日语男声

韩文:

声音风格
------------
ko-KR-SunHiNeural韩语女声
ko-KR-InJoonNeural韩语男声

其他常用:

声音语言
------------
fr-FR-DeniseNeural法语女声
de-DE-KatjaNeural德语女声
es-ES-ElviraNeural西班牙语女声
ru-RU-SvetlanaNeural俄语女声
pt-BR-FranciscaNeural葡萄牙语女声

> 💡 查看完整列表:python3 scripts/tts_edge.py "test" --list-voices


快速开始

1. 安装依赖

cd ~/.openclaw/workspace/skills/tts-synthesizer
pip install -r requirements.txt

2. 运行(生成飞书语音用这个)

# ⭐ tts_simple.py — 输出 OGG/Opus,可直接作为飞书语音发送
python3 scripts/tts_simple.py "你好,这是测试语音"

# 使用指定声音(见下方声音列表)
python3 scripts/tts_simple.py "你好" --voice zh-CN-YunxiNeural

# 使用 API
python3 scripts/tts_simple.py "你好" --engine api \
    --api-url https://api.openai.com/v1 \
    --api-key sk-xxx \
    --voice alloy

3. 调节语速和音调

# 语速 +10%(稍快)
python3 scripts/tts_simple.py "快速播报" --rate "+10%"

# 语速 -10%(稍慢)
python3 scripts/tts_simple.py "慢速播报" --rate "-10%"

# 音调升高
python3 scripts/tts_simple.py "音调较高" --pitch "+5Hz"

脚本说明

scripts/tts_simple.py ⭐ 推荐

通用的文字转语音脚本,自动输出 OGG/Opus 格式,适合飞书语音消息

python3 scripts/tts_simple.py "要转换的文字" [选项]

参数:

参数说明
------------
text要转换的文字,或 .txt 文件路径
--output, -o输出文件路径
--engine, -e引擎:edge(默认)或 api
--voice, -v声音名称
--rate, -r语速,如 +10%-5%(仅 edge)
--pitch, -p音调,如 +5Hz-3Hz(仅 edge)
--api-urlAPI URL(api 模式)
--api-keyAPI Key(api 模式)
--api-modelAPI 模型(默认 tts-1

scripts/tts_edge.py

纯粹的 edge-tts 脚本,输出 MP3 格式(不适合直接发送飞书语音)。

# 列出所有声音
python3 scripts/tts_edge.py "test" --list-voices

# 生成语音
python3 scripts/tts_edge.py "你好" -o output.mp3 --voice zh-CN-Xiaoxiao

> 💡 发送飞书语音消息请用 tts_simple.py


声音列表

edge-tts 支持 100+ 声音,可通过以下命令查看:

python3 scripts/tts_edge.py "test" --list-voices

常用声音速查:

语言代码声音
------------------
中文女声zh-CN-Xiaoxiao晓晓(默认)
中文男声zh-CN-Yunxi云希
美式女声en-US-JennyJenny
美式男声en-US-GuyGuy
英式女声en-GB-SoniaSonia
日语女声ja-JP-NanamiNanami

输出格式

重要:飞书语音消息需要 OGG/Opus 格式,必须使用 tts_simple.py

脚本输出格式适用场景
--------------------------
tts_simple.pyOGG/Opus飞书语音消息(直接发送)
tts_edge.pyMP3通用场景(需转换后才能发飞书语音)

> tts_simple.py 会自动将 edge-tts 输出的 webm 转换为 OGG/Opus,专门适配飞书语音消息。

输出目录

运行结果保存在工作区的 projects/tts-synthesizer/ 目录下:

~/.openclaw/workspace/projects/tts-synthesizer/
└── output/
    └── tts_20260401_193000.ogg   # OGG/Opus 格式(飞书语音用这个)

环境变量

变量名说明
--------------
OPENCLAW_WORKSPACE工作区根目录
TTS_API_URLOpenAI 兼容 API URL
TTS_API_KEYAPI 密钥

故障排查

edge-tts 下载失败

# 检查网络
curl -I https://www.bing.com

# edge-tts 需要访问微软服务
# 如有代理干扰,清除环境变量
unset all_proxy ALL_PROXY

API 模式报错

  • 确认 API URL 正确(包含 /v1
  • 确认 API Key 有效
  • 检查账户余额

声音不自然

  • 中文推荐:zh-CN-Xiaoxiao(晓晓)
  • 调节语速 --rate "+10%"--rate "-10%"
  • 调节音调 --pitch "+3Hz"--pitch "-3Hz"

平台说明

edge-tts vs 其他 TTS 方案

方案成本音质中文支持离线API Key
------------------------------------------
edge-tts免费很好不需要
OpenAI TTS按量计费很高一般需要
pyttsx3免费一般不需要

已知限制

  • edge-tts 依赖微软服务,需要能访问 edge.microsoft.com
  • 部分声音在不同地区可能不可用

目录结构

技能目录(发布用)

tts-synthesizer/
├── SKILL.md                    # 本文档
├── _meta.json                  # 元数据
├── .clawhub/                   # ClawHub 源信息
├── requirements.txt            # Python 依赖
└── scripts/
    ├── tts_simple.py          # 通用 TTS 脚本(⭐ 推荐)
    └── tts_edge.py            # edge-tts 专用脚本

项目目录(运行时数据)

~/.openclaw/workspace/projects/tts-synthesizer/
├── output/                    # TTS 输出文件
└── *.ogg                     # 历史语音文件

模型说明

edge-tts 无本地模型,每次联网合成(微软服务器运行)。

如需本地 GPU TTS(用你自己的显卡),需要额外安装 Coqui XTTS 等。

版本历史

共 1 个版本

  • v1.0.9 当前
    2026-05-01 23:33 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

security-compliance

Skill Manager All In One | 一站式技能管理器

moroiser
全流程管理 OpenClaw 技能的创建、修改、发布、更新、升版与审计。
★ 0 📥 1,887

STT Recognizer | STT 识别器

moroiser
语音转文字(STT)工具。支持麦克风录音,使用 Whisper(faster‑whisper)本地转写,或通过 OpenAI 兼容 API 云端转写。触发词:录音、语音转文字、STT、语音识别、转写、录音转文字。适用平台:Linux / W
★ 0 📥 532

Camera YOLO Operator | 摄像头 YOLO 操控者

moroiser
摄像头 YOLO 目标检测与 DA3Metric 深度估计;模型存放 modules 缓存,输出存放 projects。
★ 0 📥 647