将学术论文转化为结构化的中文阅读报告。输入方式(reader/)与输出格式(writer/)独立解耦,详见末尾目录结构。
> Python 约定:{PYTHON} = macOS 用 /Library/Developer/CommandLineTools/usr/bin/python3,其他环境用 python3。
确定后记住这个选择,用于 Step 2 时分发到对应的 writer。
两种模式完全独立,不得混用。规则:
规则 1:用户提供本地 PDF 文件路径
→ 使用 PDF 模式,跳转至 reader/pdf.md 执行 P1–P5。
规则 2:用户提供 arXiv 链接(不论 /pdf/ 还是 /html/ 形式)
→ 优先尝试 HTML 模式。构造 HTML URL:将 /pdf/ 替换为 /html/,并去掉末尾的 .pdf。
例:https://arxiv.org/pdf/2605.12036 → https://arxiv.org/html/2605.12036
用 curl 检查页面是否存在:
curl -sI "https://arxiv.org/html/{ARXIV_ID}" | head -1
HTTP/... 200 → HTML 模式,跳转至 reader/html.md 执行 H1–H3。规则 3:用户提供其他 HTML 页面链接
→ HTML 模式,跳转至 reader/html.md 执行 H1–H3。
> 完成对应模式的步骤后,回到本文档继续 Step 2。
完成输入处理后,{workspace}/figures/ 已包含所有目标图表。
1. 论文基本信息(标题、作者、机构、发表信息)
2. 研究背景与动机
3. 核心方法 / 技术方案(配架构图)
4. 实验设计
5. 实验结果与分析(配结果图表)
6. 主要贡献与创新点
7. 局限性与未来方向
8. 个人点评与总结
灵活性:根据论文内容可增加章节(如 Case Study、数据集详解)、合并章节(如实验设计与结果合一)、自由组织子结构。
附录内容集成:
根据报告内容需要选取,不设数量硬上限:
根据 Step 1.1 的输出格式选择,跳转到对应的 writer 文档:
每份 writer 文档包含完整的:图片处理 / 数学公式 / 表格 / 模板路径 / 文件命名 / 写作风格 / 校验清单 / 已知陷阱。
按所选 writer 文档的第 8 节"校验清单"逐项检查。
通用必检项(任何格式都适用):
{{...}} 占位符残留如果发现问题:直接修复对应文件,修复后重新保存到同一路径。
超长论文(>20 页 / >50,000 字符):分批处理,先通读整体结构,再聚焦核心章节(方法、实验、结论)。
双栏排版论文(PDF 模式):单栏图宽约 30–280 或 300–565 pt,跨栏图宽约 30–565 pt,调整裁剪坐标。
扫描版 PDF:文字模糊时通过图片阅读,报告中注明来源质量受限。
论文含附录:参照 Step 2.1 中"附录内容集成"处理。
paper-report/
├── SKILL.md # 本文件(路由 + 通用流程)
├── reader/
│ ├── html.md # 输入处理:HTML 模式(H1–H3)
│ └── pdf.md # 输入处理:PDF 模式(P1–P5)
├── writer/
│ ├── html.md # 输出格式:HTML(9 节)
│ ├── html-template.html # HTML 报告模板(含 MathJax)
│ ├── markdown.md # 输出格式:Markdown(9 节)
│ └── markdown-template.md # Markdown 报告模板
└── scripts/
├── pdf_to_images.py
├── crop_figures.py
├── extract_arxiv_text.py
└── extract_figure_urls.py
> 新增输入源:在 reader/ 加 {name}.md。新增输出格式:在 writer/ 加 {name}.md + {name}-template.{ext}。SKILL.md 主流程无需改动。
共 4 个版本