← 返回
未分类

paper-report

Convert academic papers into structured Chinese reading reports with original figures. Supports arXiv HTML and local PDF inputs. For arXiv links, HTML mode is preferred for textual accuracy. Use when the user asks to summarize, read, analyze, or create a reading report for an academic paper (PDF file or arXiv link).
Convert academic papers into structured Chinese reading reports with original figures. Supports arXiv HTML and local PDF inputs. For arXiv links, HTML mode is preferred for textual accuracy. Use when the user asks to summarize, read, analyze, or create a reading report for an academic paper (PDF file or arXiv link).
yjkj999999
未分类 community v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 13
下载
💾 0
安装
1
版本
#latest

概述

Paper Reader

将学术论文转化为结构化的中文阅读报告,支持 HTML 和 PDF 两种输入形式。输出格式默认为 HTML,用户可选 Markdown。

Python 路径约定:本文档中 {PYTHON} 代表系统 Python3 解释器路径。

  • macOS(有 CommandLineTools):/Library/Developer/CommandLineTools/usr/bin/python3
  • 其他环境:python3

Step 1: 路由决策

在开始处理之前,确定两个维度的决策:输入处理模式输出格式

1.1 确定输出格式

根据用户要求确定输出格式:

  • 用户明确指定了格式(如"生成 HTML 报告"或"给我 Markdown")→ 按用户要求。
  • 用户未指定默认使用 HTML

输出格式决定后续的图片处理方式:

  • Markdown 模式:图片保存为独立文件,Markdown 中用相对路径引用。
  • HTML 模式:图片转为 base64 内嵌,生成自包含 HTML。

> 后续步骤中,标注 [MD] 的仅 Markdown 模式执行,[HTML] 的仅 HTML 模式执行,无标注的两种都执行。

1.2 选择输入处理模式

两种模式完全独立,不得混用。根据输入类型按以下规则决定:

规则 1:用户提供本地 PDF 文件路径

→ 直接使用 PDF 模式,跳转至 path-pdf.md 执行 P1–P5。

规则 2:用户提供 arXiv 链接(不论是 /pdf/ 还是 /html/ 形式)

→ 优先尝试 HTML 模式。构造 HTML URL:将 /pdf/ 替换为 /html/,并去掉末尾的 .pdf 后缀。

例:https://arxiv.org/pdf/2605.12036https://arxiv.org/html/2605.12036

用 curl 检查 HTML 页面是否存在:

curl -sI "https://arxiv.org/html/{ARXIV_ID}" | head -1
  • 返回 HTTP/... 200 → 使用 HTML 模式,跳转至 path-html.md 执行 H1–H3。
  • 返回非 200(如 404)→ 回退到 PDF 模式,跳转至 path-pdf.md 执行 P1–P5。

规则 3:用户提供其他 HTML 页面链接

→ 直接使用 HTML 模式,跳转至 path-html.md 执行 H1–H3。

> 完成对应模式的步骤后,回到本文档继续执行 Step 2


Step 2: 生成中文阅读报告

两种模式完成各自步骤后,{workspace}/figures/ 目录中已有所有需要的图表图片。

报告结构(参考框架,可根据论文内容灵活调整)

1. 论文基本信息(标题、作者、机构、发表信息)
2. 研究背景与动机
3. 核心方法 / 技术方案(配架构图)
4. 实验设计
5. 实验结果与分析(配结果图表)
6. 主要贡献与创新点
7. 局限性与未来方向
8. 个人点评与总结

灵活性说明:以上为参考框架,不是死板模板。根据论文内容可以:

  • 增加章节(如 Case Study、数据集详解等)
  • 合并章节(如实验设计与结果合为一章)
  • 在方法章节内自由组织子结构

附录内容集成指引

  • 附录中"方法实现细节/超参数/训练配置"类内容 → 融入对应的主方法章节,让读者在一处看到完整技术描述
  • 附录中"补充实验/额外消融"类内容 → 融入实验结果章节或设独立小节
  • 附录中"独立子课题/独立证明"类内容 → 可设独立附录章节

模板参考

图片处理

[MD] Markdown 模式:将图片复制到 {workspace}/outputs/{论文简短标题}-images/,Markdown 中用相对路径引用:

![图 1 说明](./{论文简短标题}-images/fig1.png)

[HTML] HTML 模式:将图片转为 base64 嵌入:

import base64

def img_to_base64(path):
    with open(path, "rb") as f:
        data = base64.b64encode(f.read()).decode()
    ext = path.rsplit(".", 1)[-1]
    mime = {"png": "image/png", "jpg": "image/jpeg"}.get(ext, "image/png")
    return f"data:{mime};base64,{data}"

在 HTML 中使用:Figure 1

图表选取原则

根据报告内容需要选取图表,不设数量硬上限。原则:

  • 架构图/流程图:必选(帮助读者建立全局理解)
  • 主实验结果表/图:必选
  • 关键消融/对比图:如报告中有讨论则选入
  • Case Study 截图:如有且有说明价值则选入

关键写作要求

  • 全文使用中文撰写,术语首次出现时附英文原文,如"注意力机制(Attention Mechanism)"
  • 图表引用格式:"如图 1 所示,..." 或 "表 1 汇总了..."
  • 保持学术严谨性,严格基于原文,不添加原文未涉及的推测或数据
  • 每个章节应有实质内容,避免泛泛而谈
  • 不包含任何"报告生成日期"或"AI 生成"相关的描述文字
  • [HTML] 数学公式处理:使用 LaTeX 语法书写公式,行内用 $...$,独立公式用 $$...$$。模板已内置 MathJax 3,无需额外引入。生成 HTML 时注意:在 Python 中构建含公式的字符串时,使用原始字符串(raw string)或单反斜杠确保输出文件中 LaTeX 命令前是单个 \(如 \mathcal),而非双反斜杠 \\mathcal
  • [MD] 数学公式处理:使用标准 LaTeX 语法 $...$$$...$$,与主流 Markdown 渲染器兼容。

输出文件

文件命名:从论文标题中提取核心关键词作为简短标题(去除特殊字符,空格替换为短横线或下划线)。

[MD] Markdown 模式输出(保存到 {workspace}/outputs/):

  1. report_{简短标题}.md — Markdown 报告
  2. {简短标题}-images/ — 图片文件夹

[HTML] HTML 模式输出(保存到 {workspace}/outputs/):

  1. report_{简短标题}.html — 自包含 HTML(base64 内嵌图片)

Step 3: 校验

使用 Read 工具查看生成的报告文件,逐项检查:

通用检查

  • 各章节标题完整、层级清晰
  • 每个章节有实质内容,不存在空段落或占位符文本(如 {{...}}
  • 不包含"报告生成日期"或"AI 辅助生成"相关文字

[MD] Markdown 专项检查

  • 图片引用为有效相对路径,指向 {简短标题}-images/ 目录下的实际文件
  • 必须用 ls 命令显式验证图片文件存在,不可跳过

```bash

ls {workspace}/outputs/{简短标题}-images/

```

  • 逐个确认 Markdown 中每个 !... 引用的文件确实在目录中
  • 公式使用 LaTeX 内联格式($...$ 或 ` ... `),确认无乱码

[HTML] HTML 专项检查

  • HTML 基本结构完整( 齐全)
  • MathJax 已引入 中包含 MathJax 配置和 tex-svg.js 脚本引用
  • 所有 src 为有效 base64 data URI(以 data:image/png;base64,data:image/jpeg;base64, 开头)
  • 不存在外部图片链接或本地文件路径引用
  • 每张图片有描述性 alt 属性和
  • CSS 样式内嵌在