← 返回
开发者工具

rapid ocr

专业离线票据OCR工具,支持增值税发票、火车票、飞机票、出租车票等高精度字段提取与批量识别。
专业离线票据OCR工具,支持增值税发票、火车票、飞机票、出租车票等高精度字段提取与批量识别。
gaojiren
开发者工具 clawhub v1.0.4 1 版本 99824.7 Key: 无需
★ 1
Stars
📥 1,688
下载
💾 191
安装
1
版本
#latest

概述

RapidOCR Skill (v1.3.0)

描述

专业的票据 OCR 识别技能,支持增值税发票、火车票等各类票据的识别。

⚠️ 重要说明

首次运行需要网络下载模型(约 13MB),后续使用完全离线。

安全元数据说明:

  • ✅ 技能代码本身不发起任何网络请求
  • ⚠️ 依赖包 rapidocr-onnxruntime 首次调用时会自动下载模型
  • 这是依赖包的行为,不是技能代码的行为

核心特性

  • 轻量代码 - 约 4KB,无内置大文件
  • 首次下载 - 首次运行自动下载 OCR 模型(~13MB)
  • 离线推理 - 模型下载后完全离线使用
  • 安全透明 - 无 exec/eval,无运行时网络请求,代码可审计
  • 快速识别 - ~500ms/张

网络需求

阶段网络数据量
--------------------
安装依赖需要~50 MB
首次运行需要~13 MB
后续使用不需要0

外部依赖

  • PyPI 包: rapidocr-onnxruntime
  • 模型来源: PaddleOCR (Apache 2.0)
  • 模型行为: 首次运行自动下载到本地缓存

文件结构

rapid-ocr/
├── rapidocr_minimal.py    # 主程序入口 (~4KB)
├── test_ocr.py            # 测试套件
├── README.md              # 用户文档
├── TRANSPARENCY.md        # 透明度说明
├── SKILL.md               # 本文件
├── claw.json              # OpenClaw 配置
├── requirements.txt       # Python 依赖
└── models/
    └── README.md          # 模型说明

使用方式

CLI

python rapidocr_minimal.py ocr image.jpg
python rapidocr_minimal.py invoice invoice.jpg
python rapidocr_minimal.py train ticket.jpg

Python API

from rapidocr_minimal import RapidOCRSkill

skill = RapidOCRSkill()
result = skill.ocr_image("image.jpg")
print(result['full_text'])

# 发票识别
invoice_data = skill.ocr_invoice("invoice.jpg")
print(invoice_data['structured_data'])

测试

python test_ocr.py

许可证

MIT License

版本历史

共 1 个版本

  • v1.0.4 当前
    2026-03-28 23:39 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 671 📥 324,344
developer-tools

CodeConductor.ai

larsonreever
AI驱动平台,提供快速全栈开发、智能体、工作流自动化及低代码AI集成的可扩展产品创建。
★ 68 📥 180,331
productivity

fast-ocr

gaojiren
专业离线票据OCR,支持增值税发票、火车票、飞机票、出租车票等多种票据的高精度结构化识别与批量处理。
★ 0 📥 776