← 返回
未分类

OpenClaw 11-in-1 Visual Automation Suite (Windows Only) Complete visual automation toolkit with 11 integrated modules. ### 💰 Price One-time purchase: **$2.99** (Lifetime access to all modules + future updates) ### 🚀 How to Purchase 1. Pay via PayPal Invoice: 🔗 [Click to pay $2.99](https://www

Professional Windows-only visual automation toolkit with 11 modules for screenshot, OCR, template matching, clicks, input, environment setup, and looping tasks.
专业Windows视觉自动化工具包,包含11个模块:截图、OCR、模板匹配、点击、输入、环境配置及循环任务。
joriemancgemanne joriemancgemanne 来源
未分类 clawhub v1.0.1 1 版本 100000 Key: 无需
★ 0
Stars
📥 890
下载
💾 0
安装
1
版本
#ai-agent#latest#openclaw#visual-automation#windows

概述

通用电脑视觉自动化 Skill 体系

这是一个完整的 基于图像识别+OCR 的电脑自动化技能框架,包含多个可独立调用的最小执行单元,也可以自由组合成复杂的自动化任务。本技能包是合集,可以根据需求拆分使用单个单元

目录结构

computer_skill/
├─ templates/ # 永久模板库(不删除)
│  ├─ desktop/ # 桌面图标模板
│  ├─ taskbar/ # 任务栏图标模板
│  ├─ system/ # 系统通用按钮模板
│  └─ wechat/ # 微信示例模板(以后可新增其他软件)
└─ temp/ # 临时截图(用完立即删除)

核心特性

  • 🎯 原子化设计:所有功能拆分为最小可执行单元,按需组合
  • 🔍 双重定位:OCR文字识别优先,模板匹配兜底,兼顾准确性和灵活性
  • 🖱️ 全功能支持:截图、识别、定位、点击、输入全流程支持
  • ♻️ 支持循环监控:可以设置自动循环,实现持续监控和重复任务
  • 📝 简单易扩展:用 call 单元名 参数 格式即可编写新技能

所有最小可执行单元清单

单元名称固定调用名功能单独调用方式
--------------------------------------
初始化环境init_env创建目录结构、清空 temp、检查模板目录call init_env
全屏截图screenshot_full截取整个屏幕保存为 temp/screen.pngcall screenshot_full
检查截图有效性check_screenshot_valid检查是否黑屏/冻结,无效则唤醒界面call check_screenshot_valid
唤醒界面wake_window解决后台不渲染、截图黑屏问题call wake_window
OCR识别ocr_recognize识别屏幕所有文字与对应坐标call ocr_recognize
模板匹配template_match用模板图匹配定位图标/按钮call template_match 分类 模板名称
统一定位locate_targetOCR优先,找不到再用模板匹配,返回目标坐标call locate_target 目标文字 或 分类+模板名
鼠标点击mouse_click移动到指定坐标执行点击call mouse_click X Y [点击类型,默认单击]
键盘输入keyboard_input定位输入框后输入文字call keyboard_input 目标坐标/描述 输入内容
清理临时文件clean_temp删除临时截图,释放空间call clean_temp
循环重启loop_restart等待2秒后回到截图重新开始call loop_restart

使用方法

单独调用单元

格式:

call [单元调用名] [参数...]

示例:

  • 初始化环境:call init_env
  • 模板匹配微信图标:call template_match desktop wechat
  • 点击坐标(100,200)双击:call mouse_click 100 200 双击

组合成新任务

按执行顺序,每行写一个调用指令,即可组合成自定义新任务:

格式示例(打开微信):

# 任务名称:打开微信
call init_env
call screenshot_full
call check_screenshot_valid
call locate_target 微信 desktop wechat
call mouse_click {{定位结果X}} {{定位结果Y}} 双击
call clean_temp

组合步骤:

  1. 先写任务名称和说明(方便后续识别)
  2. 按执行顺序,每行一条 call 单元名 参数 指令
  3. 坐标可以用变量 {{定位结果X}} {{定位结果Y}} 承接上一个单元的输出
  4. 需要循环的话,最后加 call loop_restart
  5. 保存自定义技能后,后续直接 call 技能名称 调用

完整主流程调用示例

# 通用主流程:vision_auto_main
call init_env
call screenshot_full
call check_screenshot_valid
call ocr_recognize
# 如果需要模板匹配,加这行:call template_match 分类 名称
call locate_target 目标文字
call mouse_click {{X}} {{Y}}
# 如果需要输入文字,替换上面一行为:call keyboard_input {{X}} {{Y}} 输入内容
call clean_temp
# 需要循环就加:call loop_restart

完整主流程说明 (vision_auto_main)

执行顺序(从上到下依次执行):

  1. init_env → 初始化环境(创建目录+清空temp+检查模板目录)
  2. screenshot_full → 截取全屏保存为temp/screen.png
  3. check_screenshot_valid → 检查截图是否有效

├─ 有效 → 继续下一步

└─ 无效 → 调用 wake_window 后回到 step 2 重试

  1. ocr_recognize → OCR识别屏幕所有文字与坐标
  2. template_match → 如果需要,进行模板图匹配定位
  3. locate_target → 统一定位目标(OCR优先,模板补充)
  4. 分支执行:

├─ 需要鼠标点击 → mouse_click → 点击目标坐标

└─ 需要文字输入 → keyboard_input → 输入目标文字

  1. clean_temp → 删除临时截图,不保留任何临时文件
  2. loop_restart(可选) → 如果需要循环监控/重复任务,执行循环重启

└─ 不需要循环 → 流程结束

运行规则

  1. temp目录:只允许存在一张截图,每次运行前必须清空temp目录
  2. templates目录:目录内的图片永久保存,不删除

依赖

  • Python 3.x
  • OpenCV (模板匹配)
  • pytesseract / 其他OCR引擎
  • pyautogui (鼠标键盘控制)
  • PIL (图像处理)

版本历史

共 1 个版本

  • v1.0.1 当前
    2026-05-01 03:59 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

ai-agent

self-improving agent

pskoett
捕获经验教训、错误及修正内容,以实现持续改进。适用于以下场景:(1)命令或操作意外失败;(2)用户纠正Claude(如“不,那不对……”“实际上……”);(3)用户请求的功能不存在;(4)外部API或工具出现故障;(5)Claude发现自身
★ 4,082 📥 811,273
ai-agent

Skill Vetter

spclaudehome
AI智能体技能安全预审工具。安装ClawdHub、GitHub等来源技能前,检查风险信号、权限范围及可疑模式。
★ 1,227 📥 267,953
ai-agent

Self-Improving + Proactive Agent

ivangdavila
自我反思+自我批评+自我学习+自组织记忆。智能体评估自身工作、发现错误并持续改进。
★ 1,379 📥 320,579