← 返回
开发者工具 Key

MinerU PDF Parser

用 MinerU API 解析 PDF/Word/PPT/图片为 Markdown,支持公式、表格、OCR。适用于论文解析、文档提取。
用 MinerU API 解析 PDF/Word/PPT/图片为 Markdown,支持公式、表格、OCR。适用于论文解析、文档提取。
easonai-5589
开发者工具 clawhub v1.0.1 1 版本 99703 Key: 需要
★ 11
Stars
📥 7,165
下载
💾 1,564
安装
1
版本
#latest

概述

📄 MinerU - 文档解析神器

OpenDataLab 出品

> PDF/Word/PPT/图片 → 结构化 Markdown,公式表格全保留!


🔗 资源链接

资源链接
------------
官网https://mineru.net/
API 文档https://mineru.net/apiManage/docs
GitHubhttps://github.com/opendatalab/MinerU

🎯 功能

支持的文件类型

类型格式
------------
📕 PDF论文、书籍、扫描件
📝 Word.docx
📊 PPT.pptx
🖼️ 图片.jpg, .png (OCR)

核心优势

  1. 公式完美保留 - LaTeX 格式输出
  2. 表格结构识别 - 复杂表格也能搞定
  3. 多语言 OCR - 中英文混排无压力
  4. 版面分析 - 多栏、图文混排自动处理

🚀 API 使用 (v4)

认证

# Header 认证
Authorization: Bearer {YOUR_API_KEY}

单文件解析

# 1. 提交任务
curl -X POST "https://mineru.net/api/v4/extract/task" \
  -H "Authorization: Bearer $MINERU_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "url": "https://arxiv.org/pdf/2410.17247",
    "enable_formula": true,
    "enable_table": true,
    "layout_model": "doclayout_yolo",
    "language": "en"
  }'

# 返回: {"task_id": "xxx", "status": "pending"}

# 2. 轮询结果
curl "https://mineru.net/api/v4/extract/task/{task_id}" \
  -H "Authorization: Bearer $MINERU_TOKEN"

# 返回: {"status": "done", "result": {...}}

批量解析

# 1. 获取上传 URL
curl -X POST "https://mineru.net/api/v4/file-urls/batch" \
  -H "Authorization: Bearer $MINERU_TOKEN" \
  -d '{"file_names": ["paper1.pdf", "paper2.pdf"]}'

# 2. 上传文件到返回的 presigned URLs

# 3. 批量提交任务
curl -X POST "https://mineru.net/api/v4/extract/task/batch" \
  -H "Authorization: Bearer $MINERU_TOKEN" \
  -d '{"files": [{"url": "...", "name": "paper1.pdf"}, ...]}'

⚙️ 参数说明

参数类型说明
------------------
urlstring文件 URL (支持 http/https)
enable_formulabool启用公式识别 (默认 true)
enable_tablebool启用表格识别 (默认 true)
layout_modelstringdoclayout_yolo (快) / layoutlmv3 (准)
languagestringen / ch / auto
model_versionstringpipeline / vlm / MinerU-HTML

模型版本对比

版本速度准确度适用场景
------------------------------
pipeline⚡ 快常规文档
vlm🐢 慢最高复杂版面
MinerU-HTML⚡ 快网页样式输出

📂 输出结构

解析完成后下载的 ZIP 包含:

output/
├── full.md           # 完整 Markdown
├── content_list.json # 结构化内容
├── images/           # 提取的图片
└── layout.json       # 版面分析结果

🔧 OpenClaw 集成工作流

论文解析流程

# 1. 创建论文目录
mkdir -p "./paper-reading/[CVPR 2025] NewPaper"
cd "./paper-reading/[CVPR 2025] NewPaper"

# 2. 提交解析任务
TASK_ID=$(curl -s -X POST "https://mineru.net/api/v4/extract/task" \
  -H "Authorization: Bearer $MINERU_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://arxiv.org/pdf/XXXX.XXXXX"}' | jq -r '.task_id')

# 3. 等待完成 & 下载
# (轮询 status 直到 done,然后下载 result.zip)

# 4. 解压
unzip result.zip -d .

环境变量

~/.bashrc 或 OpenClaw config 中设置:

export MINERU_TOKEN="your_api_key_here"

⚠️ 限制

限制数值
------------
单文件大小200 MB
单文件页数600 页
并发任务数根据套餐

💡 使用技巧

  1. arXiv 论文直接用 URL

```

https://arxiv.org/pdf/2410.17247

```

  1. 中文论文用 language: ch
  1. 复杂表格用 vlm 模型
  1. 批量处理省 quota
    • 一次提交多个文件,比单个提交更高效

📚 相关资源


论文解析不再手动复制粘贴!📖

版本历史

共 1 个版本

  • v1.0.1 当前
    2026-03-28 10:32 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 668 📥 323,992
developer-tools

Agent Browser

matrixy
专为AI智能体优化的无头浏览器自动化CLI,支持无障碍树快照和基于引用的元素选择。
★ 427 📥 118,120
developer-tools

CodeConductor.ai

larsonreever
AI驱动平台,提供快速全栈开发、智能体、工作流自动化及低代码AI集成的可扩展产品创建。
★ 66 📥 180,024