← 返回
未分类

环评知识库提炼

环评报告知识库提炼工具 - 从环评报告表中提取结构化知识库文件,支持PDF/DOCX解析
环评报告知识库提炼工具 - 从环评报告表中提取结构化知识库文件,支持PDF/DOCX解析
iasgu iasgu 来源
未分类 clawhub v2.3.0 1 版本 99798.8 Key: 无需
★ 1
Stars
📥 476
下载
💾 15
安装
1
版本
#latest

概述

环评知识库提炼

从环境影响评价报告表中自动提取环境数据,生成结构化知识库文件。

输入

环评报告表文件(支持PDF、DOCX、DOC、TXT格式)

输出

生成5个知识库CSV文件:

1. 污染因子知识库(19字段)

污染物ID、行业、区域、产污工段、产污设施、原辅材料、污染物条件1-3、污染物名称、污染因子名称、污染物种类、排放位置、标准条件1-3、适用标准、标准限值-浓度/速率/高度/其他、备注、出处

2. 废气源强核算知识库(15字段)

污染物ID、污染物种类、污染因子种类、行业、区域、核算污染因子、产生量核算方法类型/依据/方法、核算公式、所需参数、产污系数、类比项目规模信息/污染物量、出处

3. 废水源强核算知识库(15字段)

同上

4. 固废源强核算知识库(16字段)

污染物ID、污染物种类、污染因子种类、固废类型、危废代码、行业、区域、核算污染因子、产生量核算方法类型/依据/方法、核算公式、所需参数、产污系数、类比项目规模信息/污染物量、出处

5. 噪声源强核算知识库(13字段)

污染物ID、污染物种类、污染因子种类、行业、区域、噪声源、规格型号、声源类型、计量单位/方式、声源源强值、降噪措施、降噪后源强值、出处

数据规范

  • 污染物ID格式行业_原辅料_产污工段_其他条件_污染物
  • 示例通用设备制造业_铸件_抛丸_/_抛丸粉尘
  • 污染物种类:废气、废水、固废、噪声
  • 空值:用 / 表示

质量核查

生成后需核查:文件完整性(5个CSV)、命名规则、字段完整性(19/15/15/16/13)、与原报告一致性(不可缩写/缩减/缺漏)

使用方法

python scripts/main.py report.pdf -o output_dir

依赖

pip install pymupdf pandas python-docx

版本历史

共 1 个版本

  • v2.3.0 当前
    2026-03-30 16:05 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

knowledge-management

web-tools-guide

user_ec205dbb
MANDATORY before calling web_search, web_fetch, browser, or opencli. Contains required error-handling procedures (web_se
★ 61 📥 157,293
knowledge-management

Summarize

paudyyin
智能摘要工具,自动为长文本、文档、网页生成摘要,提取要点与关键词,支持自定义摘要长度。
★ 956 📥 517,407
knowledge-management

Baidu web search

ide-rea
使用百度AI搜索引擎(BDSE)进行网络搜索。适用于获取实时信息、文档资料或研究课题。
★ 244 📥 107,086