← 返回
效率工具 中文

Paper Parse

Parse academic PDF papers into markdown with figure extraction.
将学术PDF论文解析为Markdown,并提取图表。
chen-li-17
效率工具 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 551
下载
💾 7
安装
1
版本
#latest

概述

Paper Parse

Parse academic PDF papers into structured markdown with figure extraction using PyMuPDF.

Usage

uv run {baseDir}/scripts/parse_paper.py --pdf /path/to/paper.pdf [--output-dir ./output]

Output

The tool generates:

  • {paper_name}_content.md - Full paper content in markdown
  • {paper_name}_parsed.json - Structured metadata including:
  • Paper title
  • Number of pages
  • Extracted figures with captions and paths
  • cover_title_authors.png - First-page snapshot focused on title + authors region
  • figures/ - Directory containing high-resolution figure screenshots

Example

uv run scripts/parse_paper.py --pdf ~/papers/my-paper.pdf --output-dir ./parsed

Output structure:

./parsed/
├── my-paper_content.md
├── my-paper_parsed.json
└── figures/
    ├── figure_1.png
    ├── figure_2.png
    └── ...

Dependencies

  • PyMuPDF (fitz) - PDF parsing and rendering
  • pymupdf4llm - Markdown conversion

These are automatically managed by uv via the inline script metadata.

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-29 23:07 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

productivity

Weather

steipete
获取当前天气和预报(无需API密钥)
★ 444 📥 226,106
productivity

Word / DOCX

ivangdavila
创建、检查和编辑 Microsoft Word 文档及 DOCX 文件,支持样式、编号、修订记录、表格、分节符及兼容性检查等功能。
★ 437 📥 147,175
content-creation

Paper Card Analyzer

chen-li-17
分析 `paper-parse` 输出,直接以自然语言生成研究型论文卡片。请在解析论文后需要生成论文卡片时使用此技能。
★ 0 📥 529