← 返回
未分类 Key

火山引擎豆包语音播客

生成火山引擎豆包语音播客(PodcastTTS)。输入主题文本,自动生成双人对话式播客音频。
根据主题文本自动生成双人对话式播客音频(使用火山引擎豆包语音 PodcastTTS)
cindypapa cindypapa 来源
未分类 clawhub v1.1.1 1 版本 100000 Key: 需要
★ 1
Stars
📥 484
下载
💾 0
安装
1
版本
#latest

概述

火山引擎豆包语音播客生成

基于火山引擎 PodcastTTS API,输入主题文本,AI 自动生成双人对话播客音频(含片头音乐、多轮对话、片尾结束)。

前提条件

  1. Python >= 3.9
  2. 安装 websockets>=14.0
  3. 火山引擎账号已开通 PodcastTTS 服务

快速开始

1. 环境变量配置(推荐)

export VOLC_APPID="your_appid"
export VOLC_ACCESS_TOKEN="your_access_token"
export VOLC_APP_KEY="your_app_key"  # 可选,默认 aGjiRDfUWi

2. 命令行调用

python scripts/generate_podcast.py "Hermes和OpenClaw怎么选"

3. Python 代码调用

import asyncio
from scripts.generate_podcast import PodcastGenerator

async def main():
    gen = PodcastGenerator(
        appid="3398567544",
        access_token="your_token",
    )
    result = await gen.generate(
        text="今天来聊聊AI编程助手",
        output_dir="./output",
        encoding="mp3",
        use_head_music=True,
    )
    print(result["final_files"])  # 输出音频路径列表

asyncio.run(main())

参数说明

PodcastGenerator 初始化参数

参数类型必填默认值说明
--------------------------------
appidstr-应用 ID
access_tokenstr-Access Token
app_keystraGjiRDfUWiApp Key
resource_idstrvolc.service_type.10050资源 ID
endpointstrwss://openspeech...WebSocket 端点

generate() 方法参数

参数类型默认说明
------------------------
textstr必填输入主题文本
output_dirstroutput输出目录
encodingstrmp3音频格式: mp3/wav/pcm
use_head_musicboolTrue是否加片头音乐
use_tail_musicboolFalse是否加片尾音乐
only_nlp_textboolFalse只生成文本不生成音频
return_audio_urlboolFalse返回音频URL而非流式
speaker_infodict{"random_order":False}说话人配置
speech_rateint0语速
skip_round_audio_saveboolFalse跳过分段保存
voice_typestrNone音色类型: zh_male / zh_female / multi
normalize_audioboolFalse是否对音频进行音量归一化
fade_in_outboolFalse是否添加淡入淡出效果

音色选择 (voice_type)

说明
------------
None默认,AI 自动分配
zh_male中文男声
zh_female中文女声
multi多人对话模式

返回结果

{
    "success": True,
    "output_dir": "/abs/path/to/output",
    "segment_files": ["output/head_music_-1.mp3", "output/zh_female_0.mp3", ...],
    "final_files": ["output/podcast_final_1234567890.mp3"],
    "duration": 164.51,
    "texts": [
        {"text": "今天这期...", "speaker": "zh_female_mizaitongxue_v2_saturn_bigtts"},
        ...
    ],
    "usage": {"input_text_tokens": 0, "output_audio_tokens": 2800, "total_tokens": 2800}
}

CLI 参数

python scripts/generate_podcast.py "主题文本" \
    -o ./output \
    -f mp3 \
    --no-head-music \
    --tail-music \
    --only-text \
    --voice-type zh_female \
    --normalize \
    --fade \
    --appid YOUR_APPID \
    --token YOUR_TOKEN \
    -v

技术说明

  • 协议: 自定义二进制 WebSocket 协议(封装在 protocols.py 中)
  • 流式下发: 音频以 4~10KB 分片实时流式下发
  • 断点续传: 支持从中断轮次自动重试
  • 音频合并: 自动合并所有分段为完整音频
  • 音频后处理: 支持音量归一化(peak -1dB)和淡入淡出(0.5s)

注意事项

  1. Access Token 需从火山引擎控制台获取
  2. 每次调用消耗相应的 audio token
  3. 音频采样率固定为 24kHz
  4. 对话角色由 AI 自动分配(通常为一男一女双人对话)
  5. 音色选择 voice_type 为提示性参数,最终音色由服务端根据内容智能匹配

版本历史

共 1 个版本

  • v1.1.1 当前
    2026-05-03 09:12 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

Qqbot Voice Transcribe

cindypapa
QQ Bot 语音自动识别v2.0,自动解码 Silk V3,使用 Whisper medium 模型识别,集成 Gateway,支持用户确认流程。
★ 0 📥 354

HappyHorse 视频创作助手

cindypapa
使用阿里云百炼 HappyHorse 模型生成视频,支持首帧/尾帧控制的图生视频和文生视频。
★ 0 📥 365

Seedream Ppt Maker

cindypapa
Seedream图片PPT制作器——宝玉布局框架 + Seedream 5.0文生图,自动生成图片PPT。交互式分步确认流程降低修改次数,节省API配额。
★ 0 📥 451