OOXML(.docx)中,段落的"大纲等级"有两个来源,优先级从高到低:
(段落属性直接指定),该样式在 styles.xml 中定义了 OutlineLvl 取值:0=最高级(类似Heading1),1=二级,... 8=九级。
向用户确认要分析的 .docx 文件路径。如果用户只说"当前文件夹",则列出当前目录中的 .docx 文件让用户选择。
使用 scripts/extract_outline.py 脚本:
python <skill-base>/scripts/extract_outline.py <docx文件路径> [--output <输出txt路径>]
参数说明:
--output(可选):输出 txt 路径,默认与 docx 同目录、同文件名 + _大纲目录.txt脚本自动完成:
styleId → outlineLvl 映射表输出:
======================================================================
文档大纲等级目录
文件:xxx.docx
日期:2026-05-27
======================================================================
[L0] 施工经验 ← 样式ID=1 → outlineLvl=0
[L1] 第一节 总体施工部署 ← 样式ID=2 → outlineLvl=1
[L2] 1.总体思想 ← 样式ID=3 → outlineLvl=2
[L2] 2.施工部署的原则
[L1] 第二节 测量方案
[L2] ...
────────────────────────────────────────────────────────
统计:L0=2段 L1=18段 L2=38段 合计=58段
======================================================================
| 情况 | 处理方式 |
|---|---|
| ------ | --------- |
| styles.xml 中样式无 outlineLvl | 该样式段落视为普通正文,不输出 |
| 段落既无直接 outlineLvl 也无样式 | 跳过(普通正文) |
| 段落直接 outlineLvl 与样式不同 | 以段落直接值为准 |
共 1 个版本