← 返回
内容创作 中文

epub-eink-optimizer

This skill should be used when the user wants to optimize an epub file for e-ink readers (墨水屏电子书). It handles image deduplication, removal of tiny decorative...
This skill should be used when the user wants to optimize an epub file for e-ink readers (墨水屏电子书). It handles image deduplication, removal of tiny decorative...
wangkf
内容创作 clawhub v1.0.0 1 版本 99798.8 Key: 无需
★ 1
Stars
📥 476
下载
💾 8
安装
1
版本
#latest

概述

epub 墨水屏优化技能

目标

将 epub 文件中的图片进行四步优化,大幅减小文件体积,同时保留在墨水屏设备上的可读性。

核心脚本

scripts/optimize_epub.py — 一键运行全部优化步骤,支持单独开关每个步骤。

# 全量优化(推荐默认用法)
python skills/epub-eink-optimizer/scripts/optimize_epub.py <epub路径>

# 先分析,不修改文件
python skills/epub-eink-optimizer/scripts/optimize_epub.py <epub路径> --dry-run

# 自定义参数示例
python skills/epub-eink-optimizer/scripts/optimize_epub.py <epub路径> \
    --max-width 600 \
    --quality 65 \
    --min-size 20480

# 只做某几步
python skills/epub-eink-optimizer/scripts/optimize_epub.py <epub路径> \
    --no-dedup --no-clean-small

参数说明:

| 参数 | 默认值 | 说明 |

|------|--------|------|

| --max-width | 800 | 图片最大宽度(像素),超过则等比缩小 |

| --quality | 70 | JPEG 压缩质量(1-95),70 为画质与体积的平衡点 |

| --min-size | 10240 | 清除低于此字节数的图片(默认 10KB) |

| --no-dedup | — | 跳过重复图片合并 |

| --no-resize | — | 跳过宽度缩放 |

| --no-recompress | — | 跳过 JPEG 重压缩 |

| --no-clean-small | — | 跳过清小图 |

| --dry-run | — | 仅分析,不修改文件 |

四步优化流程

步骤 1:去重复图片

同一张图片以不同文件名出现在多篇文章中(常见于转载同款配图、作者反复使用的插图)。

  • 用 MD5 哈希识别完全相同的图片
  • 保留文件名排序靠前的一份,其余删除
  • 自动更新所有 XHTML 中的引用和 OPF manifest

步骤 2:清除小图

微信公众号文章末尾通常插有固定的二维码、点赞、广告等装饰性小图(通常 < 5KB),对阅读毫无价值。

  • 删除低于 --min-size 字节的图片文件
  • 从 XHTML 中移除对应的 标签
  • 清理残留的空

    /

    标签

步骤 3:缩放大图

墨水屏设备分辨率通常为 1024-1448px 宽,超出无意义。

  • 将宽度超过 --max-width 的图片等比缩小
  • JPEG 保存为 JPEG,PNG 保存为 PNG
  • 中间使用 LANCZOS 高质量缩放算法

步骤 4:JPEG 重压缩

epub 中的 JPEG 原始质量往往是 85-95,对墨水屏来说过于精细。

  • --quality(默认 70)重新压缩所有 JPEG
  • 使用 optimize=True 开启哈夫曼表优化
  • 通常可节省 15-25%

典型效果参考

| 场景 | 优化前 | 优化后 | 压缩率 |

|------|--------|--------|--------|

| 微信公众号合集(100篇+) | 70MB | 13MB | ~82% |

| 图文并茂博客(50篇) | 30MB | 8MB | ~73% |

| 纯文字为主(少量配图) | 5MB | 3MB | ~40% |

手动处理补充指南

脚本覆盖大多数场景,以下情况需要手动干预(参考 references/manual-fixes.md):

  • 图片为 base64 内嵌(非独立文件)
  • epub 内部目录结构非标准(如多层嵌套)
  • 需要将彩色图片转为灰度以进一步减体积

依赖

pip install Pillow

Python 标准库:zipfile, hashlib, re, io, os

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-30 06:58 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

content-creation

Humanizer

biostartechnology
消除AI写作痕迹,使文本更自然真实。基于维基百科"AI写作特征"指南,识别并修正夸张象征、宣传用语、肤浅-ing分析、模糊归因、破折号滥用、三项排比、AI词汇、负面平行结构及冗长连接词等模式。
★ 860 📥 199,662
content-creation

Baidu Wenku AIPPT

ide-rea
使用百度文库 AI 智能生成 PPT,自动根据内容选择模板。
★ 66 📥 46,173
content-creation

AdMapix

fly0pants
广告情报与应用数据分析助手,支持搜索广告素材、分析应用排名、下载量、收入及市场洞察,用于广告素材和竞品分析。
★ 295 📥 136,464