← 返回
数据分析 Key

ebook-to-md

Convert PDF/PNG/JPEG/MOBI/EPUB to Markdown. Uses Baidu OCR only. Use when 扫描PDF转Markdown、pdf ocr、图像识别、电子书转Markdown、ebook to markdown.
Convert PDF/PNG/JPEG/MOBI/EPUB to Markdown. Uses Baidu OCR only. Use when 扫描PDF转Markdown、pdf ocr、图像识别、电子书转Markdown、ebook to markdown.
whille
数据分析 clawhub v1.0.0 1 版本 99889.5 Key: 需要
★ 0
Stars
📥 904
下载
💾 45
安装
1
版本
#latest

概述

ebook_to_md Skill

将 PDF、图片、MOBI、EPUB 转为 Markdown。仅使用百度 OCR。

输入格式

  • PDF:扫描版/图像型 PDF
  • PNG/JPEG:单张图片
  • MOBI/EPUB:需安装 Calibre,先转 PDF 再处理

图片 OCR 输出会自动添加 Markdown 分段:首行若为短标题则转为 ##,对话段落前插入空行。

输出格式

仅输出 Markdown(.md)。

参数

ParameterTypeRequiredDefaultDescription
--------------------------------------------------
input_pathstringyes-文档路径(pdf/png/jpeg/mobi/epub)或 base64 图片
output_pathstringno-输出文件路径
ocr_backendstringno"baidu"保留参数,仅支持百度
inline_imagesboolnotrue图片是否 base64 内联

快速开始

# PDF 转 Markdown(百度 OCR)
python scripts/ebook_to_md.py --input_path=./scanned.pdf
# 图片转 Markdown
python scripts/ebook_to_md.py --input_path=./screenshot.png
# 指定输出路径
python scripts/ebook_to_md.py --input_path=./report.pdf --output_path=./report.md

依赖

Python

pip install requests

系统

  • Calibre(mobi/epub):brew install calibre
  • 百度 OCR:设置 BAIDU_OCR_API_KEYBAIDU_OCR_SECRET_KEY

使用示例

百度 OCR(默认)

from skills.ebook_to_md import main
main(input_path='./report.pdf', output_path='./report.md')
main(input_path='./image.png')  # 图片识别

MOBI/EPUB(需 Calibre)

main(input_path='./book.epub', output_path='./book.md')
main(input_path='./book.mobi', output_path='./book.md')

返回格式

成功:返回字符串,含预览;若指定 output_path 则写入文件。

失败:返回 "错误: ..."

相关

  • pdf_to_markdown:原生文本 PDF 转换(docling)

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-29 16:13 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

A股量化 AkShare

mbpz
A股量化数据分析工具,基于AkShare库获取A股行情、财务数据、板块信息等。用于回答关于A股股票查询、行情数据、财务分析、选股等问题。
★ 166 📥 60,253
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 199 📥 65,262
content-creation

抖音下载器(Node.js)

whille
抖音无水印视频下载和文案提取工具
★ 4 📥 3,191