```
PyMuPDF==1.23.26
requests==2.31.0
```
步骤1:报告文件解析
scripts/pdf_parser.py 分别解析三份PDF报告```bash
python scripts/pdf_parser.py --url "
python scripts/pdf_parser.py --url "
python scripts/pdf_parser.py --url "
```
--url:PDF文件的URL地址或本地路径(必填)--output:提取内容的保存路径(选填,不指定则输出到控制台)步骤2:关键信息提取
根据 references/report_template.md 中的结构要求,智能体将从三份报告中提取关键信息:
步骤3:数据交叉验证
步骤4:综合报告生成
references/report_template.md 的格式要求生成综合诊断报告```
一、企业概况
二、财务健康度分析
三、税务合规性评估
四、政策红利与补贴机会
五、综合诊断结论与建议
```
示例1:标准三报告整合
用户:请整合这三份企业诊断报告
报告1:[企业基本信息报告URL]
报告2:[财税诊断报告URL]
报告3:[政策匹配报告URL]
执行流程:
1. 调用脚本解析三份PDF
2. 提取关键信息并分类
3. 交叉验证数据一致性
4. 生成综合诊断报告Markdown文档
示例2:部分报告分析
用户:分析这份财税诊断报告
执行流程:
1. 调用脚本解析PDF
2. 提取财税关键指标
3. 生成财务健康度分析报告
4. 标注缺失的企业基本信息和政策匹配内容
共 1 个版本