← 返回
未分类 Key 中文

Qwen Vision

Analyze images and videos using Qwen Vision API (Alibaba Cloud DashScope). Supports image understanding, OCR, visual reasoning.
利用通义千问视觉API(阿里云灵积)分析图像和视频,支持图像理解、OCR及视觉推理。
perchouli perchouli 来源
未分类 clawhub v0.1.0 1 版本 99890 Key: 需要
★ 0
Stars
📥 1,817
下载
💾 33
安装
1
版本
#latest

概述

Qwen Vision

Analyze images and videos using Alibaba Cloud's Qwen Vision API (通义千问视觉模型).

Usage

Analyze an image:

uv run {baseDir}/scripts/analyze_image.py --image "/path/to/image.jpg" --prompt "请描述这张图片" --api-key sk-xxx

With custom model:

uv run {baseDir}/scripts/analyze_image.py --image "/path/to/image.jpg" --model qwen-vl-max-latest --api-key sk-xxx

API Key

Get your API key from:

  • models.providers.bailian.apiKey in ~/.openclaw/openclaw.json
  • Or skills."qwen-image".apiKey in ~/.openclaw/openclaw.json
  • Or DASHSCOPE_API_KEY environment variable
  • Or https://dashscope.console.aliyun.com/

Models

ModelDescription
--------------------
qwen-vl-max-latestLatest max model (default)
qwen-vl-plus-latestFaster, cost-effective

Prompt Examples

TaskPrompt
--------------
Describe"请详细描述这张图片的内容"
OCR"提取图片中的所有文字"
Count"数一下图中有多少个物体"
Analyze"分析这张图表的数据趋势"
Identify"这是什么地方/物品?"

Notes

  • Supports JPG, PNG, GIF, WebP, BMP formats
  • Images are encoded as base64 and sent via API
  • Response time varies by image size and complexity

版本历史

共 1 个版本

  • v0.1.0 当前
    2026-03-29 17:46 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

ai-agent

self-improving agent

pskoett
捕获经验教训、错误及修正内容,以实现持续改进。适用于以下场景:(1)命令或操作意外失败;(2)用户纠正Claude(如“不,那不对……”“实际上……”);(3)用户请求的功能不存在;(4)外部API或工具出现故障;(5)Claude发现自身
★ 4,114 📥 835,925
ai-agent

Find Skills

guipi888
场景驱动+关键词双模式技能发现工具。当用户用自然语言描述场景/需求(如"我想做一个海报""帮我分析股票"),或明确说"安装技能/find skills/找个skill"时,自动从官方内置、本地已安装、SkillHub、虾评、GitHub、C
★ 1,480 📥 543,367
ai-agent

Agent Browser

rez0
用于 AI 代理的浏览器自动化 CLI。当用户需要与网站交互(包括浏览页面、填写表单、点击按钮、截图等)时使用。
★ 840 📥 317,574