← 返回
未分类 Key

voice-minimax

通过MiniMax API生成高质量语音,转换为OPUS格式并发送至飞书用户,可支持语音条和可转发MP3文件。
使用MiniMax API生成高质量语音,转为OPUS并发送至飞书,支持语音条和可转发MP3。
zhuchenggong19851114-design zhuchenggong19851114-design 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 需要
★ 0
Stars
📥 294
下载
💾 0
安装
1
版本
#latest

概述

voice-minimax - 语音生成技能

MiniMax TTS 生成语音 → lark-cli 发送到飞书

配置

发布前需替换以下占位符:

  • 你的MiniMax API Key → 你的 MiniMax API Key
  • 飞书用户ID → 飞书用户 open_id(默认:ou_c1e599d5838a3f2ab8c4dbc40b709cf2)

默认行为(OPUS 语音条)

用户只说"生成语音"时,默认用这个流程:

# 1. TTS 生成 MP3(Python)
python3 -c "
import urllib.request, json

MINIMAX_KEY = '你的MiniMax API Key'

data = json.dumps({
    'model': 'speech-2.8-hd',
    'text': '文字内容',
    'stream': False,
    'voice_setting': {'voice_id': 'male-qn-qingse', 'speed': 1},
    'audio_setting': {'sample_rate': 32000, 'bitrate': 128000, 'format': 'mp3'}
}).encode()

req = urllib.request.Request(
    'https://api.minimaxi.com/v1/t2a_v2',
    data=data,
    headers={'Authorization': f'Bearer {MINIMAX_KEY}', 'Content-Type': 'application/json'}
)

with urllib.request.urlopen(req) as resp:
    result = json.load(resp)

audio_hex = result['data']['audio']
audio_bytes = bytes.fromhex(audio_hex)
with open('/tmp/voice.mp3', 'wb') as f:
    f.write(audio_bytes)
"

# 2. 转 OPUS
ffmpeg -i /tmp/voice.mp3 -c:a libopus -ar 16000 -ac 1 -b:a 64k -vbr off -map_metadata -1 -bitexact /tmp/voice.opus -y

# 3. 发语音条
cp /tmp/voice.opus ./voice.opus
lark-cli --as bot im +messages-send \
  --user-id 飞书用户ID \
  --msg-type audio \
  --audio ./voice.opus

选项:MP3 文件(需明确说"文件形式"/"可转发")

用户说"文件形式"或"要能转发"时用这个:

cp /tmp/voice.mp3 ./voice.mp3
lark-cli --as bot im +messages-send \
  --user-id 飞书用户ID \
  --msg-type file \
  --file ./voice.mp3

关键参数

参数
-----------
MiniMax APIhttps://api.minimaxi.com/v1/t2a_v2
Modelspeech-2.8-hd(不是 speech-01-turbo)
Voice IDmale-qn-qingse
OPUS 采样率16000 Hz
OPUS 码率64 kbps
OPUS vbroff

  1. 必须 --as bot:默认 user identity 发到错误会话,看不到
  2. OPUS 参数:16000Hz mono 64kbps vbr=off,否则 duration=0
  3. MiniMax model:要用 speech-2.8-hd,不是 speech-01-turbo

适用场景

  • 语音自我介绍
  • 重要消息朗读
  • 内容播报

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 18:01 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 431 📥 117,511
design-media

UI/UX Pro Max

xobi667
提供 UI/UX 设计智能与实现指导,帮助打造精美界面。适用于 UI 设计、UX 流程、信息架构、视觉风格、设计系统/标记、组件规格、文案/微文案、无障碍及前端 UI(HTML/CSS/JS、React、Next.js、Vue、Svelte
★ 223 📥 48,349
design-media

Openai Whisper

steipete
使用 Whisper CLI 进行本地语音转文字(无需 API 密钥)
★ 333 📥 94,367