← 返回
未分类

LIyong-企业信贷画像生成器0.1版

信贷尽调客户画像自动化生成技能。解析ZIP压缩包中的银行流水、征信报告等资料,生成标准化Excel报表。支持数据核验和流水规则过滤。
信贷尽调客户画像自动化生成技能。解析ZIP压缩包中的银行流水、征信报告等资料,生成标准化Excel报表。支持数据核验和流水规则过滤。
李勇
未分类 community v1.0.0 1 版本 93750 Key: 无需
★ 0
Stars
📥 15
下载
💾 0
安装
1
版本
#latest

概述

信贷尽调客户画像自动化生成

概述

本技能自动化解析信贷尽调客户资料压缩包,生成标准化客户画像Excel报表。

输入为一个 ZIP 压缩包(内含 PDF/XLSX/JPG 等尽调资料),

输出为按照尹伯群征信统计表格式生成的 5 Sheet Excel 报表。


核心原则

  • 严格遵循版式:禁止自由改版式、禁止缺统计项
  • 数据准确性优先:所有数字必须交叉核验
  • XLSX 优先:对私流水、开票数据等若有 XLSX 版本,优先使用
  • 扫描件标注:无法提取文字时标注待OCR

执行流程

第一步:接收输入并解压 ZIP

使用 scripts/zip_extract.py 正确解压 GBK 编码的 ZIP 文件。

from scripts.zip_extract import extract_zip_with_gbk
extract_zip_with_gbk(zip_path, output_dir)

解压完成后列出所有文件并按类型分类。

第二步:安装依赖

PYTHON="C:/Users/Administrator/.workbuddy/binaries/python/versions/3.13.12/python.exe"
$PYTHON -m venv C:/Users/Administrator/.workbuddy/binaries/python/envs/default
C:/Users/Administrator/.workbuddy/binaries/python/envs/default/Scripts/pip.exe install openpyxl pdfplumber pandas

第三步:解析文件

按优先级解析:

  1. 客户信息统计表 XLSX(最高优先级)- 直接读取,通常包含多个Sheet
  2. 对公银行流水 - 参考 references/bank_parsing_rules.md
  3. 对私银行流水 - XLSX优先,其次PDF
  4. 企业信用报告 - pdfplumber提取,关注关注类/不良类
  5. 个人信用报告 - 非扫描件可提取,扫描件标注待OCR
  6. 开票数据 - 从XLSX提取24个月数据
  7. 房产信息 - 从PDF/图片提取

第四步:生成 Excel 报表

生成文件:姓名_公司名_尽调画像_YYYYMMDD.xlsx

严格按照尹伯群征信统计表格式,包含5个Sheet:

  • Sheet1 尽调画像总表:基本信息、房产、流水汇总、贷款、信用卡、担保、负债、征信、风险提示
  • Sheet2 对公流水月度汇总:按月度统计各银行借贷方
  • Sheet3 对私流水月度汇总:按月度统计各银行收支
  • Sheet4 开票经营数据:24个月数据+前十大下游
  • Sheet5 企业征信详情:授信、担保、风险分类

第五步:数据核验

参考 references/verification_rules.md

  • L1:原始数据对照(银行汇总vs解析结果)
  • L2:交叉验证(流水vs开票、流水vs征信)
  • L3:异常标记(同名互转、法股互转等)

第六步:输出与汇报

使用 open_result_view 展示Excel文件,并按格式汇报核心数据和风险提示。


流水规则过滤(可选)

当用户明确请求时,应用5条剔除规则:

| 规则 | 说明 |

|------|------|

| ①同名互转 | 同一客户名下账户互转 |

| ②法/股互转 | 法人/股东与公司对公账户互转 |

| ③当日对倒 | 同日同金额进出 |

| ④关联闭环 | 资金经多账户后回流 |

| ⑤金融借款 | 来自金融平台的借款 |

使用 scripts/filter_flow.py 实现过滤逻辑。

输出过滤后Excel(3个Sheet):剔除明细、有效流水、过滤统计。


常见问题

| 问题 | 解决方案 |

|------|----------|

| ZIP文件名乱码 | 使用scripts/zip_extract.py正确解码GBK |

| 光大银行PDF文字重复 | 用itertools.groupby去重 |

| 中信银行列偏移 | debit用row[6]、credit用row[7] |

| openpyxl合并单元格报错 | 先赋值再调用merge_cells |


技术栈

| 用途 | 工具 |

|------|------|

| ZIP解压 | Python zipfile + cp437/gbk解码 |

| PDF解析 | pdfplumber |

| Excel读写 | openpyxl |

| 数据处理 | pandas |

| OCR | pytesseract(需先安装Tesseract) |

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-06-07 20:31 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 666 📥 323,791
ai-intelligence

self-improving agent

pskoett
捕获经验教训、错误和纠正,以实现持续改进。使用时机:(1)命令或操作意外失败;(2)用户纠正……
★ 4,055 📥 795,910
ai-intelligence

Self-Improving + Proactive Agent

ivangdavila
自我反思+自我批评+自我学习+自组织记忆。智能体评估自身工作、发现错误并持续改进。
★ 1,349 📥 317,697