本SKILL用于解析招标文件,自动识别并提取6类关键信息,生成结构化的Word(DOCX)分析报告(带PDF原始页码标注)。
当用户输入以下任一内容时,应加载本SKILL:
根据输入类型选择解析方式:
输入为PDF文件 ⚠️ 必须使用带页码的PDF转换工具
scripts/extract_pdf_with_pages.py(基于pdfplumber库,保留页码信息)
```bash
cd "[workspace]"
py scripts/extract_pdf_with_pages.py "PDF文件路径"
# 或指定输出路径
py scripts/extract_pdf_with_pages.py "PDF文件路径" "输出TXT路径"
```
_带页码.txt (默认与PDF同目录)
@pdf skill(无法保留页码信息)
输入为DOCX文件
@docx skill 读取内容
Markdown Converter skill 转换
输入为文本内容
输入为文件路径
使用方法:读取 references/extraction_prompt.md 文件,获取完整的提取提示词模板。
执行步骤:
references/extraction_prompt.md 文件内容
[在此插入招标文件文本内容] 位置
提取的6类信息:
⚠️ 重要:
P5、P9-10)
将提取的6类信息整合为一个完整的Markdown文档,包含:
# 招标文件解析报告
P5、P9-10)
保存为Markdown文件:
招标文件解析报告_[项目名称]_[YYYYMMDD].md
[workspace]/(工作空间根目录)
招标文件解析报告_未知项目_[YYYYMMDD].md
执行方式:使用Python脚本 scripts/md_to_docx.py 将Markdown报告转换为DOCX格式。
⚠️ 重要:此步骤为必须执行步骤,DOCX格式为默认输出格式。
执行命令:
cd "[workspace]"
py scripts/md_to_docx.py "招标文件解析报告_XXX_YYYYMMDD.md" "招标文件解析报告_XXX_YYYYMMDD.docx"
输入输出:
[workspace]/招标文件解析报告_[项目名称]_[YYYYMMDD].md
[workspace]/招标文件解析报告_[项目名称]_[YYYYMMDD].docx
格式规范:
references/report_format.md
P4、P9-15
注意:
[workspace] 为当前会话的工作空间路径(如 e:/000 Skills/招标文件解析)
| 工具 | 路径 | 说明 |
|------|------|------|
| ✅ extract_pdf_with_pages.py | scripts/extract_pdf_with_pages.py | 基于pdfplumber,保留页码,优先使用 |
| ❌ @pdf skill | — | 禁止使用(无法保留页码) |
| 工具 | 路径 | 说明 |
|------|------|------|
| ✅ md_to_docx.py | scripts/md_to_docx.py | 核心转换脚本,已修复字体/表格问题 |
| ✅ validate_and_fix_md.py | scripts/validate_and_fix_md.py | MD格式检查与自动修复 |
| ✅ auto_convert.py | scripts/auto_convert.py | 一键格式检查+转换 |
@docx skill 或 Markdown Converter skill
pdfplumber # PDF解析
python-docx # DOCX生成
references/extraction_prompt.md:提取提示词模板
references/report_format.md:报告格式规范
[workspace]:当前会话工作空间根目录
e:/000 Skills/招标文件解析
scripts/:可执行脚本目录(位于 .workbuddy/skills/bidding-document-parser/scripts/)
references/:模板和格式规范文档
[workspace]/ 目录
共 2 个版本