macOS 专用桌面自动化,执行看→想→做→验证循环完成任务。
【浏览器域】→ browser 工具(网页操作)
【桌面域】 → screencapture + osascript + cliclick(系统操作)
看 → 想 → 做 → 验证
使用 browser 工具:
browser navigate url="..." — 导航browser snapshot — 获取DOM快照browser screenshot — 截图browser click ref="A7" — 按ref点击元素browser type ref="..." text="..." — 输入文本browser evaluate script="..." — 执行JSscreencapture -x /tmp/screen.png
然后用 image 工具分析截图内容。
cliclick p # 先获取当前鼠标位置
cliclick c:500,300 # 点击坐标(500,300)
cliclick dc:500,300 # 双击
cliclick fi:/tmp/button.png # 找图点击(全屏搜索)
# 文本粘贴法(推荐)
osascript -e 'set the clipboard to "要输入的文本"'
osascript -e 'tell application "System Events" to keystroke "v" using command down'
# 直接按键
osascript -e 'tell application "System Events" to keystroke "return"'
osascript -e 'tell application "System Events" to keystroke "g" using {command down, shift down}'
# macOS打开/保存对话框输入路径
cliclick kd:cmd,shift:g # Cmd+Shift+G
osascript -e 'set the clipboard to "/Users/macmini/Desktop/目标文件.txt"'
osascript -e 'tell application "System Events" to keystroke "v" using command down'
osascript -e 'tell application "System Events" to keystroke "return"'
mv /源路径 /目标路径
cp /源路径 /目标路径
mkdir -p /目录路径
curl -o /保存路径 "https://url"
浏览器域→桌面域切换时必须:
五个触发信号:点击无响应超过2秒 | 出现macOS对话框 | 涉及文件保存/打开/下载 | 对话框消失 | 焦点切换到桌面应用
执行复杂任务时维护任务栈:
主任务:用户任务描述
[浏览器域] 步骤1 ✓ 完成
[浏览器域] 步骤2 ● 进行中
├─ [浏览器域] 子步骤2a ✓ 完成
└─ [桌面域] 处理对话框 ● 当前位置
[浏览器域] 步骤3 ○ 待执行
桌面域需要 macOS Accessibility 权限:
1. browser navigate → feishu网页版
2. browser snapshot → 找到输入框
3. browser click → 点击输入框
4. browser type → 输入内容
5. browser click → 发送按钮
1. exec → mkdir -p ~/目标目录
2. exec → for f in ~/源目录/*.csv; do mv "$f" ~/目标目录/; done
3. exec → ls ~/目标目录/ | wc -l → 验证数量
1. browser navigate → 目标页面
2. browser evaluate → 获取下载链接
3. exec → curl -o ~/保存路径 "URL"
4. exec → ls ~/保存路径 → 验证
共 1 个版本