← 返回
未分类 Key

minimax_ttsvoicereponse_feishu

Convert text to speech using MiniMax API and send voice bubble messages on Feishu upon user voice reply requests.
调用 MiniMax API 将文本转为语音,在用户语音回复时通过飞书发送语音气泡消息。
aaronjager92 aaronjager92 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 需要
★ 0
Stars
📥 296
下载
💾 0
安装
1
版本
#latest

概述

Voice Reply Skill - 语音回复技能

> 🤖 支持平台:飞书(Feishu)

>

> 将文字转换为语音气泡,通过飞书发送


⚠️ 首次使用必读

使用前必须配置 MiniMax API Key,否则无法运行!

配置方式:

  1. 获取 Key:https://www.minimaxi.com/
  2. 设置环境变量:export MINIMAX_VOICE_API_KEY="your-key"

或创建配置文件:cp config.example.txt config.txt 并填入 Key

  1. 验证:python3 scripts/voice_reply.py "测试"

详见下方「首次使用配置」章节。


功能

当检测到用户请求语音回复时,自动:

  1. 获取要转换的文字
  2. 调用 MiniMax TTS API 生成语音
  3. 转换为 OGG 格式(飞书语音气泡格式)
  4. 通过飞书发送语音消息

触发方式

用户发送以下任一方式都会触发:

  • 语音回复:xxx语音回复 xxx
  • /voice xxx
  • 直接说"说给我听"
  • 说"语音回复"

首次使用配置

1. 获取 MiniMax API Key

  1. 注册 MiniMax 开放平台:https://www.minimaxi.com/
  2. 在控制台创建项目,获取 API Key
  3. 设置环境变量(推荐):

```bash

export MINIMAX_VOICE_API_KEY="your-api-key-here"

```

2. 配置文件方式(可选)

如果不想设置环境变量,可以创建配置文件:

cp config.example.txt config.txt
# 编辑 config.txt,填入你的 API Key

3. 验证

python3 scripts/voice_reply.py "你好,测试一下"

成功后会在终端打印:/path/to/output.ogg


技术细节

流程

文字 → MiniMax TTS (MP3) → FFmpeg转OGG → 飞书语音气泡

音频格式

  • TTS 输出:MP3 (32kHz)
  • 飞书语音气泡:OGG (Opus codec)
  • 转换后采样率:48000Hz
  • 比特率:128kbps

依赖

  • Python 3.8+
  • requests 库:pip install requests
  • ffmpeg(系统命令)
  • MiniMax TTS API Key

可用音色

voice_id说明
----------------
male-qn-qingse男性青涩音色(默认)
female-qn-qingse女性青涩音色
male-qn-jingqi男性京片子
female-qn-tianmei女性甜妹
...更多音色见 MiniMax 文档

修改方法:编辑 scripts/voice_reply.py,找到 voice_id 字段


文件结构

minimax_ttsresponse_feishu/
├── SKILL.md              # 本文件
├── config.example.txt    # 配置示例
├── scripts/             # 脚本目录
│   └── voice_reply.py   # 主脚本
└── references/         # 参考文档
    └── README.md        # 详细说明

常见问题

Q: 提示"网络请求失败"

A: 检查 API Key 是否正确配置,网络是否畅通

Q: 提示"API返回错误"

A: 检查 API Key 是否有 TTS 权限,或额度是否充足

Q: 飞书收不到语音

A: 确认是飞书平台,微信不支持原生语音气泡

Q: 想换音色

A: 编辑 scripts/voice_reply.py,修改 voice_id 参数


贡献

欢迎提交 Issue 和 PR!

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 17:58 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

knowledge-management

markdownknowledge

aaronjager92
将本地 Markdown 知识库与 OpenClaw 集成,支持语义检索和上下文注入。仅在用户触发时检索(搜索知识库、查一下知识库等),不主动注入。
★ 0 📥 525
design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 431 📥 117,547
design-media

UI/UX Pro Max

xobi667
提供 UI/UX 设计智能与实现指导,帮助打造精美界面。适用于 UI 设计、UX 流程、信息架构、视觉风格、设计系统/标记、组件规格、文案/微文案、无障碍及前端 UI(HTML/CSS/JS、React、Next.js、Vue、Svelte
★ 223 📥 48,395