← 返回
未分类 Key

Volcengine Ai

火山引擎AI生成与理解API。让Agent能够调用火山引擎方舟的AI能力:图片生成(Seedream-5.0-lite)、视频生成(Seedance-1.5-pro)、图片理解、视频理解。使用前需配置API密钥(VOLCENGINE_API_KEY)。支持异步任务查询。
火山引擎AI生成与理解API,Agent可调用方舟的图生成(Seedream‑5.0‑lite)、视频生成(Seedance‑1.5‑pro)以及图片/视频理解能力。使用前需配置API密钥(VOLCENGINE_API_KEY),支持异步任务查询。
zzhimin zzhimin 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 需要
★ 0
Stars
📥 293
下载
💾 1
安装
1
版本
#latest

概述

火山引擎 AI

调用火山引擎方舟平台的AI能力。

配置

首先设置环境变量:

export VOLCENGINE_API_KEY="222b33d4-f22f-4f99-b68f-0eb9150ab507"
# 或在 ~/.bashrc 中持久化
echo 'export VOLCENGINE_API_KEY="222b33d4-f22f-4f99-b68f-0eb9150ab507"' >> ~/.bashrc

模型ID

能力模型ID
--------------
图片生成doubao-seedream-5-0-lite
视频生成doubao-seedance-1-5-pro-251215
图片理解doubao-seed-1-8-251228
视频理解doubao-seed-1-8-251228

核心命令

1. 图片生成 (Seedream)

# 调用火山引擎API生成图片
curl -X POST "https://ark.cn-beijing.volces.com/api/v3/visual generation/tasks" \
  -H "Authorization: Bearer $VOLCENGINE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedream-5-0-lite",
    "prompt": "一只戴墨镜的橘猫",
    "size": "1024x1024",
    "num": 1
  }'

2. 视频生成 (Seedance)

# 提交视频生成任务
curl -X POST "https://ark.cn-beijing.volces.com/api/v3/video generation/tasks" \
  -H "Authorization: Bearer $VOLCENGINE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedance-1-5-pro-251215",
    "prompt": "镜头推进,一只橘猫从沙发上跳下来",
    "duration": 5,
    "ratio": "16:9"
  }'

3. 图片理解

# 图片理解(视觉理解)
curl -X POST "https://ark.cn-beijing.volces.com/api/v3/chat/completions" \
  -H "Authorization: Bearer $VOLCENGINE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seed-1-8-251228",
    "messages": [
      {
        "role": "user",
        "content": [
          {"type": "image_url", "image_url": {"url": "https://example.com/image.jpg"}},
          {"type": "text", "text": "描述这张图片"}
        ]
      }
    ]
  }'

4. 视频理解

# 视频理解(使用视频URL)
curl -X POST "https://ark.cn-beijing.volces.com/api/v3/chat/completions" \
  -H "Authorization: Bearer $VOLCENGINE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seed-1-8-251228",
    "messages": [
      {
        "role": "user",
        "content": [
          {"type": "video_url", "video_url": {"url": "https://example.com/video.mp4"}},
          {"type": "text", "text": "描述这个视频"}
        ]
      }
    ]
  }'

5. 查询任务结果

对于异步任务(图片/视频生成),需要查询任务状态:

curl -X GET "https://ark.cn-beijing.volces.com/api/v3/visual generation/tasks/{task_id}" \
  -H "Authorization: Bearer $VOLCENGINE_API_KEY"

常用参数

图片生成

  • prompt: 描述词
  • size: 尺寸,如 "1024x1024"、"16:9"
  • num: 生成数量

视频生成

  • prompt: 描述词
  • duration: 时长(秒)
  • ratio: 比例,如 "16:9"、"9:16"

注意事项

  1. 生成任务是异步的,需要轮询任务状态
  2. 图片/视频理解是同步的,直接返回结果
  3. API端点根据区域选择,这里用 cn-beijing

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 20:58 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

Shop Health Check

zzhimin
跨境电商店铺健康度自动巡检 Skill。支持多店铺配置,定时检查站点可用性、响应时间、SSL证书健康度、关键页面404/内容缺失,异常时自动推送到飞书。
★ 0 📥 341

Audio Recognition

zzhimin
音频语音识别服务(Speech-to-Text)。当用户上传音频文件,需将语音转为文字或识别特定信息(如关键词、歌曲名)时触发。适用于:会议录音转写、音频内容提取、语音指令识别、音视频字幕生成。
★ 0 📥 436

Product Opportunity Analyzer

zzhimin
从电商评论中挖掘产品机会,自动抓取1‑3星评论并使用Map‑Reduce提取痛点,生成产品洞察报告。用户发送亚马逊商品链接时触发该技能。
★ 0 📥 362