← 返回
未分类 Key

doubao-media

Doubao (Volcengine ARK) 文生图、文生视频工具 - 生成后自动发送到对话,无需手动查找文件。Text-to-image and text-to-video with auto-send to chat.
豆包(Volcengine ARK)文生图、文生视频工具,生成后自动发送至对话,无需手动查找文件。
systiger systiger 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 需要
★ 0
Stars
📥 381
下载
💾 0
安装
1
版本
#latest

概述

Doubao Media / 豆包媒体生成

> 中文: 豆包(字节跳动火山引擎ARK)文生图、文生视频工具。生成后自动发送到对话,无需手动查找文件。

>

> English: Doubao (ByteDance Volcengine ARK) text-to-image and text-to-video tool. Auto-sends generated content to chat, no manual file search needed.


Features / 功能特点

Feature中文English
------------------------
Text-to-Image✅ 文生图✅ Generate images from text
Text-to-Video✅ 文生视频✅ Generate videos from text
Image-to-Video✅ 图生视频✅ Generate videos from images
Auto-Send to Chat✅ 自动发送到对话✅ Auto-send to conversation
Windows Compatible✅ Windows 兼容✅ Windows compatible

Prerequisites / 前置条件

Required / 必需

  • ARK_API_KEY - Get from / 从控制台获取: https://console.volcengine.com/ark
  • Python 3.8+ with requests library

Install Dependencies / 安装依赖

pip install requests

Set API Key / 设置 API Key

# Windows PowerShell
$env:ARK_API_KEY="your_api_key_here"

# Linux/Mac
export ARK_API_KEY="your_api_key_here"

Usage / 使用方法

Generate Image / 生成图片

python scripts/doubao_media.py img "一只可爱的橘猫在阳光下睡觉"

Result / 结果:

  • Image saved to output/ directory / 图片保存到 output/ 目录
  • Auto-sent to chat / 自动发送到对话

Generate Video / 生成视频

# Sync mode (wait for completion) / 同步模式(等待完成)
python scripts/doubao_media.py vid "一只猫在草地上奔跑" --duration 5

# Async mode (return task ID) / 异步模式(返回任务ID)
python scripts/doubao_media.py vid "一只猫在草地上奔跑" --async

Generate Video from Image / 图生视频

python scripts/doubao_media.py vid "让这只猫动起来" --image "https://example.com/cat.jpg"

Check Video Status / 检查视频状态

python scripts/doubao_media.py status "task_xxxxx"

Parameters / 参数说明

Image Generation / 图片生成

ParameterDefaultDescription
---------------------------------
promptRequiredText description / 文本描述
--size1024x1024Image size: 1024x1024, 1024x1536, 1536x1024

Video Generation / 视频生成

ParameterDefaultDescription
---------------------------------
promptRequiredText description / 文本描述
--duration5Duration in seconds (2-12) / 时长(秒)
--ratio16:9Aspect ratio: 16:9, 4:3, 1:1, 9:16
--imageNoneImage URL for image-to-video / 图生视频的图片URL
--asyncFalseAsync mode / 异步模式

Available Models / 可用模型

Model IDFunctionDescription
---------------------------------
doubao-seedream-3-0-t2i-250415Text-to-Image / 文生图Generate images from text
doubao-seedance-1-0-pro-250528Text-to-Video / 文生视频Generate videos from text or images

Output / 输出

Generated files are saved to / 生成的文件保存到:

~/.openclaw/workspace/output/
├── img_YYYYMMDD_HHMMSS.jpeg    # Images / 图片
└── vid_YYYYMMDD_HHMMSS.mp4     # Videos / 视频

Performance / 性能指标

OperationTimeDescription
------------------------------
Text-to-Image / 文生图10-30sDepends on complexity
Text-to-Video / 文生视频1-3min5-second video

Troubleshooting / 故障排除

Error: ARK_API_KEY not set

Solution / 解决方案:

$env:ARK_API_KEY="your_api_key"  # Windows
export ARK_API_KEY="your_api_key"  # Linux/Mac

Error: InvalidEndpointOrModel.NotFound

Solution / 解决方案:

Go to Volcengine Console → Model Management and activate the required models.

前往火山引擎控制台 → 模型管理,开通所需模型。

Required models / 需要开通的模型:

  • Doubao-SeeDream-3.0-T2I (Text-to-Image)
  • Doubao-Seedance-1.0-Pro (Text-to-Video)

Error: UnicodeEncodeError (Windows)

Solution / 解决方案:

The script handles this automatically with PYTHONIOENCODING=utf-8.


Security / 安全

  • Never hardcode API keys / 永远不要硬编码 API Key
  • Use environment variables / 使用环境变量存储敏感信息
  • Regularly rotate keys / 定期轮换 API Key

References / 参考资源


Version / 版本: 1.0.0

Last Updated / 最后更新: 2026-03-29

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-03 09:03 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

UI/UX Pro Max

xobi667
提供 UI/UX 设计智能与实现指导,帮助打造精美界面。适用于 UI 设计、UX 流程、信息架构、视觉风格、设计系统/标记、组件规格、文案/微文案、无障碍及前端 UI(HTML/CSS/JS、React、Next.js、Vue、Svelte
★ 216 📥 46,899
design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 427 📥 116,451
design-media

Openai Whisper

steipete
使用 Whisper CLI 进行本地语音转文字(无需 API 密钥)
★ 330 📥 93,317