当用户要把文档转成 Markdown 时,优先使用这个 skill,而不是手写一堆临时请求。
pdf、doc、docx、ppt、pptx、图片或 htmlxlsx/csv 一类表格文件,这个 skill 不覆盖MINERU_API_TOKEN,默认走精准解析 API;没有则自动走免 token 的 Agent APIoutputs/mineru/logs/mineru_markdown.log单个本地文件:
uv run python /absolute/path/to/skills/mineru-doc-to-markdown/scripts/mineru_to_markdown.py ./resume.pdf
批量本地文件:
uv run python /absolute/path/to/skills/mineru-doc-to-markdown/scripts/mineru_to_markdown.py ./a.pdf ./b.docx
远程 URL:
uv run python /absolute/path/to/skills/mineru-doc-to-markdown/scripts/mineru_to_markdown.py "https://cdn-mineru.openxlab.org.cn/demo/example.pdf"
指定输出目录:
uv run python /absolute/path/to/skills/mineru-doc-to-markdown/scripts/mineru_to_markdown.py ./resume.pdf --output-dir ./outputs/custom
强制使用轻量免 token 模式:
uv run python /absolute/path/to/skills/mineru-doc-to-markdown/scripts/mineru_to_markdown.py ./resume.pdf --mode agent
强制使用精准解析模式:
uv run python /absolute/path/to/skills/mineru-doc-to-markdown/scripts/mineru_to_markdown.py ./resume.pdf --mode precise
触发条件:
--mode preciseMINERU_API_TOKEN 且未指定 --mode本地文件:
POST /api/v4/file-urls/batch 申请上传地址PUTGET /api/v4/extract-results/batch/{batch_id}full_zip_urlfull.md远程 URL:
POST /api/v4/extract/task/batchGET /api/v4/extract-results/batch/{batch_id}full_zip_urlfull.md触发条件:
--mode agent--mode本地文件:
POST /api/v1/agent/parse/filefile_urlGET /api/v1/agent/parse/{task_id}markdown_url远程 URL:
POST /api/v1/agent/parse/urlGET /api/v1/agent/parse/{task_id}markdown_url.md 路径告诉用户autoauto 下优先精准解析,其次轻量 Agentvlmfull.md 是主产物,.zip 保留用于排查或复用共 1 个版本