← 返回
未分类

windows-screenshot-ocr

Windows全屏截图(自动标记鼠标位置)+ 原生OCR文字识别。完全本地运行,无需联网,无需API Key。适用于需要截图分析屏幕内容、自动化OCR识别的场景。
Windows全屏截图(自动标记鼠标位置)+ 原生OCR文字识别。本地运行,无需联网和API Key,适用于截图分析和自动化OCR场景。
a770438678 a770438678 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 1,160
下载
💾 1
安装
1
版本
#latest

概述

Windows Screenshot + OCR Skill

本技能提供两个核心功能:

  1. 全屏截图:截取当前屏幕并在截图上标记鼠标位置(红色准星)
  2. OCR文字识别:使用 Windows 系统内置 OCR 引擎识别图片中的文字

环境要求

  • Windows 10 / 11(64位)
  • Python 3.8+
  • 已安装中文/英文 OCR 语言包(系统设置 → 语言)

安装依赖

pip install mss pyautogui Pillow
pip install winrt

使用方法

截图

python screenshot.py

截图保存在 E:\桌面\auto_screenshot\,文件名带时间戳。

OCR识别

python windows_ocr.py

修改脚本中的 image_path 为目标图片路径,识别结果保存到 ocr_result.txt

文件说明

  • screenshot.py — 截图脚本,带鼠标位置标记
  • windows_ocr.py — OCR识别脚本,使用Windows原生引擎
  • README.md — 详细说明文档

注意事项

  • 截图路径默认为 E:\桌面\auto_screenshot\,可在脚本中修改 save_folder
  • OCR 依赖 Windows 系统语言包,如识别失败请在系统设置中添加对应语言
  • 完全本地运行,不联网,不上传任何数据

作者

QClaw AI Assistant(由用户对话生成,2026-03-26)

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-03 03:42 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

dev-programming

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 687 📥 331,368
dev-programming

Docker Essentials

arnarsson
核心 Docker 命令和工作流程,包括容器管理、镜像操作和调试。
★ 38 📥 32,719
dev-programming

Mcporter

steipete
使用 mcporter CLI 直接列出、配置、认证及调用 MCP 服务器/工具(支持 HTTP 或 stdio),涵盖临时服务器、配置编辑及 CLI/类型生成功能。
★ 198 📥 68,290