← 返回
开发者工具 中文

Virtual Desktop Browser

Launch Chromium in non-headless mode inside Xvfb virtual display (fixed 1200x720x24) and automate with human-like mouse/keyboard/screenshot operations. Use f...
在 Xvfb 虚拟显示(固定 1200x720x24)中以非无头模式启动 Chromium,通过拟人化的鼠标、键盘和截图操作实现自动化。
nhzallen
开发者工具 clawhub v1.0.0 1 版本 99840.5 Key: 无需
★ 0
Stars
📥 626
下载
💾 24
安装
1
版本
#automation#browser#chromium#latest#pyautogui#twitter#xiaohongshu#xvfb

概述

Virtual Desktop Browser Skill

This skill provides a deterministic GUI automation runtime:

  • Xvfb virtual display (1200x720x24)
  • Chromium non-headless browser
  • PyAutoGUI control (click/type/hotkey/scroll)

Required system packages

apt-get update
apt-get install -y xvfb chromium-browser \
  libnss3 libgconf-2-4 libxss1 libasound2 \
  libatk1.0-0 libatk-bridge2.0-0 libcups2 \
  libdrm2 libgbm1 libgtk-3-0 libxshmfence1 x11-utils

Python dependencies

pip install -r requirements.txt

Tool surface

All tools return JSON dicts.

  • browser_start(url=None, display=None) — start Xvfb + Chromium
  • browser_stop() — close processes
  • browser_snapshot(region=None) — screenshot as Base64 PNG
  • browser_click(x, y, button='left', clicks=1, duration=0.5) — move + click
  • browser_type(text, interval=0.05, wpm=None) — type at focus
  • browser_hotkey(keys, interval=0.05) — key combos
  • browser_scroll(clicks=1, direction='vertical', x=None, y=None) — mouse wheel
  • browser_find_image(image_path, confidence=0.8) — template matching (OpenCV)
  • browser_get_pixel_color(x, y) — read RGB
  • browser_activate_window(title_substring) — focus window by title

Notes

  • Browser lifecycle is manual: start once, multi-step flow, then stop.
  • Display auto-assigns (:99..:199) if not provided.
  • Failsafe: moving mouse to bottom-right corner triggers pyautogui abort.

Language

See docs/ for translations:

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-19 22:20 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 668 📥 324,150
developer-tools

CodeConductor.ai

larsonreever
AI驱动平台,提供快速全栈开发、智能体、工作流自动化及低代码AI集成的可扩展产品创建。
★ 68 📥 180,164
developer-tools

Gog

steipete
Google Workspace 命令行工具,支持 Gmail、日历、云端硬盘、通讯录、表格和文档。
★ 921 📥 185,796