← 返回
未分类 Key 中文

PDF to LaTeX

Convert PDF documents to LaTeX source using MinerU. Extracts text, formulas, and structure from PDFs and outputs LaTeX format for academic and technical docu...
使用 MinerU 将 PDF 文档转换为 LaTeX 源码,提取文本、公式和结构,输出 LaTeX 格式,适用于学术和技术文档。
mzlzyca mzlzyca 来源
未分类 clawhub v0.4.0 1 版本 100000 Key: 需要
★ 0
Stars
📥 552
下载
💾 1
安装
1
版本
#latest

概述

PDF to LaTeX

Convert PDF documents to LaTeX format using MinerU. Best suited for academic papers and documents with formulas or complex layouts.

Install

npm install -g mineru-open-api
# or via Go (macOS/Linux):
go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

Quick Start

# Convert PDF to LaTeX (requires token)
mineru-open-api extract paper.pdf -f latex -o ./out/

# With VLM model for better accuracy on complex layouts
mineru-open-api extract paper.pdf -f latex --model vlm -o ./out/

# From arXiv URL
mineru-open-api extract https://arxiv.org/pdf/2309.10918 -f latex -o ./out/

Authentication

Token required:

mineru-open-api auth             # Interactive token setup
export MINERU_TOKEN="your-token" # Or via environment variable

Create token at: https://mineru.net/apiManage/token

Capabilities

  • Supported input: .pdf (local file or URL)
  • Output format: LaTeX (-f latex)
  • LaTeX output requires extract with token — not available in flash-extract
  • Use --model vlm for papers with complex math, tables, or multi-column layouts
  • Language hint with --language (default: ch, use en for English)

Notes

  • LaTeX output (-f latex) is only available via extract with token
  • --model vlm gives higher accuracy but may have rare hallucination risk; use pipeline for guaranteed fidelity
  • Output goes to stdout by default; use -o to save to a file
  • All progress/status messages go to stderr; document content goes to stdout
  • MinerU is open-source by OpenDataLab (Shanghai AI Lab): https://github.com/opendatalab/MinerU

版本历史

共 1 个版本

  • v0.4.0 当前
    2026-05-03 05:07 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

dev-programming

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 681 📥 329,025
dev-programming

Mcporter

steipete
使用 mcporter CLI 直接列出、配置、认证及调用 MCP 服务器/工具(支持 HTTP 或 stdio),涵盖临时服务器、配置编辑及 CLI/类型生成功能。
★ 196 📥 67,898
office-efficiency

Doc Parse

mzlzyca
使用MinerU从Word文档(.doc、.docx)中解析提取结构化内容,转换为格式规范的Markdown。保留完整文档层级结构(标题、段落等)
★ 0 📥 879