← 返回
未分类 Key

volc-vision

使用火山引擎 ARK API 做图片理解、图片描述、视觉问答与图像分析。适用于用户发来图片并询问“这是什么”“图里有什么”“帮我看下这张图”“描述一下图片内容”“识别图片中的信息”等场景,也适用于需要对本地图片、图片 URL 或 base64 图片做理解和问答时。
使用火山引擎 ARK API 做图片理解、图片描述、视觉问答与图像分析。适用于用户发来图片并询问“这是什么”“图里有什么”“帮我看下这张图”“描述一下图片内容”“识别图片中的信息”等场景,也适用于需要对本地图片、图片 URL 或 base64 图片做理解和问答时。
big-dust big-dust 来源
未分类 clawhub v0.1.0 1 版本 99872.1 Key: 需要
★ 0
Stars
📥 781
下载
💾 80
安装
1
版本
#latest

概述

volc-vision

火山引擎 ARK API 图像理解服务。

适用场景

  • 用户发送图片并询问关于图片的问题
  • 需要理解、分析、描述图片时
  • 用户说“看看这张图”“描述一下”“这图是什么”“图里有什么”“帮我分析图片内容”
  • 需要对本地图片路径、图片 URL 或 base64 图片做视觉问答

输入参数

参数必填说明
------------------
image图片路径、URL 或 base64
prompt要问的问题,默认 描述这张图片

使用方式

# 命令行调用
node skills/volc-vision/index.js <图片路径> "<问题>"

# 示例
node skills/volc-vision/index.js /path/to/image.jpg "描述这张图片"
node skills/volc-vision/index.js https://example.com/image.jpg "这图里有什么"

模型优先级(按强弱排序)

Vision 系列优先,其他模型按能力依次降序:

  1. doubao-seed-1-6-vision-250815 🌟 首选
  2. doubao-1-5-vision-pro-32k-250115 🌟
  3. doubao-seed-2-0-pro-260215
  4. doubao-seed-1-8-251228
  5. doubao-seed-2-0-lite-260215
  6. doubao-seed-2-0-mini-260215

自动切换:如果不指定模型,会按列表顺序依次尝试可用模型,直到成功。

环境变量

# 必需:ARK API Key
export ARK_API_KEY="your_api_key"

# 可选:指定模型
export VISION_MODEL="doubao-seed-1-6-vision-250815"

指定模型

ARK_API_KEY=your_api_key VISION_MODEL=doubao-seed-1-6-vision-250815 node skills/volc-vision/index.js <图片> "<问题>"

返回

  • 图片描述
  • 视觉问答结果
  • 图像分析文本结果

调用示例

用户:看看这张图
-> agent 调用: node skills/volc-vision/index.js /root/.openclaw/media/inbound/xxx.jpg "描述这张图片"
-> 返回描述结果

注意事项

  • 使用前必须设置 ARK_API_KEY
  • 如果用户只是要生成图片而不是理解图片,不要误用本技能
  • 若已有明确视觉问题,优先把问题放进 prompt,不要只做泛泛描述

版本历史

共 1 个版本

  • v0.1.0 当前
    2026-03-30 23:38 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

img-upload

big-dust
将本地图片上传至 img.scdn.io 免费图床,返回可分享的公开链接。适用于需要生成外链、分享、上传截图或引用本地图片的场景。
★ 0 📥 338

Feishu Bot Full Setup

big-dust
创建飞书企业自建机器人,完成权限导入、事件订阅、卡片回调和版本发布全流程。适用于机器人或飞书应用机器人的创建及自动化建机器人流程。
★ 0 📥 310

artifact-organizer

big-dust
按任务阶段而不是按文件类型整理混合产物。当编码、写作、脚本处理、研究、自动化或多步骤任务产生多个文件,且文件开始散落、临时产物与最终产物混在一起、目录结构不清晰,或用户提出“整理目录”“整理工作区”“归类”“归档”“收整产物”“文件有点乱”
★ 0 📥 299