批量识别发票。
此技能需要翔云 OCR 服务,使用前必须先配置凭证!
主动询问用户:
> "使用此技能需要翔云 netocr_key 和 netocr_secret,请提供这两个凭证。\
> 获取方式:翔云个人中心"
然后运行:
python scripts/recognize_invoices.py --config
告诉用户:
> "请先运行以下命令配置翔云凭证:"
> ```bash
> python ~/.openclaw/skills/invoice-ocr/scripts/recognize_invoices.py --config
> ```
| 票种名称 | 票种代码 |
|---|---|
| :------- | :------- |
| 增值税专用发票 | 01 |
| 机动车销售统一发票 | 03 |
| 增值税普通发票 | 04 |
| 增值税专用电子发票 | 08 |
| 增值税电子普通发票 | 10 |
| 增值税普通发票(卷票) | 11 |
| 通行费增值税电子普通发票 | 14 |
| 二手车销售统一发票 | 15 |
| 数电发票(增值税专用发票) | 09 |
| 数电发票(普通发票) | 83 |
| 数电发票(航空运输电子客票行程单) | 61 |
| 数电发票(铁路电子客票) | 62 |
| 电子发票(机动车销售统一发票) | 63 |
| 数电发票(二手车销售统一发票) | 64 |
| 电子发票(普通发票) 通行费 | 72 |
| 数电纸质发票(增值税专用发票) | 91 |
| 数电纸票发票(普通发票) | 92 |
| 数电纸质发票(机动车销售统一发票) | 93 |
| 数电纸票发票(二手车销售统一发票) | 94 |
| 火车票 | 20 |
| 区块链发票 | 21 |
| 船票 | 22 |
| 定额发票 | 23 |
| 机打发票 | 24 |
| 出租车发票 | 25 |
| 客运汽车 | 26 |
| 航空运输电子客票行程单 | 27 |
| 过路费 | 28 |
| 打车行程单 | 31 |
| 货物清单 | 33 |
| 财政电子票据 | 34 |
| 海关缴款书 | 35 |
| 通用电子发票 | 36 |
| 完税证明 | 37 |
| 医疗票据 | 38 |
| 退票费报销凭证 | 39 |
| 非税收入一般缴款书(电子) | 40 |
| 车辆通行费通用(电子)发票 | 41 |
| 银行回单 | 42 |
| 格式 | 扩展名 |
|---|---|
| ------ | -------- |
| OFD | .ofd |
| 图片 | .jpg, .jpeg, .png, .bmp |
# 识别文件夹中的所有发票
python scripts/recognize_invoices.py /path/to/invoices
# 识别单张发票
python scripts/recognize_invoices.py /path/to/invoices/123.png
# 设置翔云凭证
python scripts/recognize_invoices.py --config
# 查看当前配置
python scripts/recognize_invoices.py --list-config
详细 API 说明见 翔云 OCR API 参考
发票文件 → OCR识别 → 返回结果
↓ ↓ ↓
PDF/图片 混贴识别 JSON结构
共 2 个版本