← 返回
未分类 Key

文档识别-表格识别(翔云开放平台)

文档 OCR 识别技能。扫描文件夹中的文档(PDF/图片),调用翔云 OCR API 识别文档信息。**重要:首次使用必须先配置翔云凭证,主动向用户索要 netocr_key 和 netocr_secret,或引导用户运行 --config 命令自行配置。**
妮妮
未分类 community v2.0.1 3 版本 99295.8 Key: 需要
★ 0
Stars
📥 141
下载
💾 8
安装
3
版本
#latest

概述

文档 OCR 识别技能

批量识别文档。

⚠️ 首次使用必须配置凭证

此技能需要翔云 OCR 服务,使用前必须先配置凭证!

方式一:向用户提供凭证(推荐)

主动询问用户:

> "使用此技能需要翔云 netocr_key 和 netocr_secret,请提供这两个凭证。\

> 获取方式:翔云个人中心"

然后运行:

python scripts/recognize_doc.py --config

方式二:引导用户自行配置

告诉用户:

> "请先运行以下命令配置翔云凭证:"

> ```bash

> python ~/.openclaw/skills/invoice-ocr/scripts/recognize_doc.py --config

> ```

特点

支持语言代码
:-------:-------
简体中文(印刷)0
简体中文(印刷+手写)3
繁体中文(印刷)1
繁体中文(印刷+手写)4
英文2
阿拉伯5
乌尔都6
格鲁吉亚7
西里尔文8
法文9
西班牙文10
日文11
韩文12
葡萄牙文13
越南14
孟加拉15

支持的文件格式

格式扩展名
--------------
PDF.pdf
OFD.ofd
图片.jpg, .jpeg, .png, .bmp , .tif, .tiff, .webp

使用方法

识别文档

# 识别文件夹中的所有文档
python scripts/recognize_doc.py /path/to/doc

# 识别单文档
python scripts/recognize_doc.py /path/to/doc/123.png

配置管理

# 设置翔云凭证
python scripts/recognize_doc.py --config

# 查看当前配置
python scripts/recognize_doc.py --list-config

获取 netocr_key 和 netocr_secret

  1. 登录翔云
  2. 在个人中心获得

详细 API 说明见 翔云 OCR API 参考

工作流程

文档文件 → OCR识别 → 返回结果(输出原文不必翻译)
   ↓                    ↓
 PDF/图片             md结构

注意事项

  1. 图片需清晰,建议长宽 > 500px
  2. 单个文件不超过 10MB
  3. 翔云 OCR 按次计费,注意费用控制
  4. 配置文件保存在技能目录下的 config.json

版本历史

共 3 个版本

  • v2.0.1 Initial release 当前
    2026-04-16 11:01 安全 安全
  • v2.0.0 Initial release
    2026-04-15 18:59 安全 安全
  • v1.0.0 Initial release
    2026-04-15 15:39 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

发票识别(翔云开放平台)

user_6b190ef3
发票 OCR 识别技能。扫描文件夹中的发票文件(PDF/图片),调用翔云 OCR API 识别发票信息。支持 40+ 种发票类型(增值税发票、火车票、出租车票、机票行程单、定额发票、机动车销售发票、过路过桥费发票等)。使用场景:(1) 用户
★ 0 📥 174

发票识别-发票查验-发票OCR(翔云开放平台)

user_6b190ef3
翔云发票识别与查验 Skill。当用户请求以下操作时触发: - 发票识别、发票 OCR、识别发票 - 发票查验、发票验真、发票核验、核查发票真伪 - 扫描发票、读取发票信息、提取发票数据 - 增值税发票识别、电子发票识别、数电票识别 - 发
★ 1 📥 145

银行卡识别OCR (翔云开放平台)

user_6b190ef3
翔云平台银行卡 OCR 识别 Skill。调用翔云 API (typeId=17) 对图片中的银行卡进行结构化识别,输出卡号、卡类型、卡名称、银行名称、银行编号等字段。支持 Base64 图片流和本地文件两种方式。触发场景:用户提到银行卡识
★ 0 📥 72