概述

安全PDF转图片PDF Skill

发布信息

作者：安全陈工
版本：2.0
创建日期：2026-05-29
最后更新：2026-05-30
许可证：MIT
技能类型：用户技能
适用场景：PDF文档处理、文档归档、信息安全

技能目的

将PDF文件的每一页渲染为JPEG图片，然后重新组合成新的PDF文件。生成的新PDF不可编辑，适用于文档归档、防篡改和保护敏感信息等场景。使用JPEG格式可大幅减小输出文件大小。

使用场景

用户要求将PDF转换为图片PDF
用户需要使PDF内容不可编辑
用户需要保护PDF文档不被篡改
用户需要将PDF用于长期归档
用户提到"PDF转图片"、"图片PDF"、"不可编辑PDF"等关键词

使用方法

1. 检查依赖

使用前需要确认已安装PyMuPDF库：

pip install PyMuPDF

2. 执行转换

使用 scripts/pdf_to_image_pdf.py 脚本进行转换：

# 单文件处理
python scripts/pdf_to_image_pdf.py input.pdf

# 批量处理（处理当前目录所有PDF）
python scripts/pdf_to_image_pdf.py "*.pdf"

# 批量处理（处理指定目录）
python scripts/pdf_to_image_pdf.py /path/to/folder/

参数说明：

input：输入PDF文件、目录或通配符模式（如 *.pdf）
-o, --output-dir：（可选）输出目录，默认与输入文件同目录
--dpi：（可选）DPI分辨率，默认150
--quality：（可选）JPEG质量1-100，默认85
--overwrite：（可选）覆盖已存在的输出文件
--batch：（可选）强制批量处理模式

示例：

# 单文件处理（默认参数）
python scripts/pdf_to_image_pdf.py document.pdf

# 单文件处理（指定输出目录和参数）
python scripts/pdf_to_image_pdf.py document.pdf -o output_dir/ --dpi 200 --quality 85

# 批量处理当前目录所有PDF
python scripts/pdf_to_image_pdf.py "*.pdf"

# 批量处理指定目录，覆盖已存在文件
python scripts/pdf_to_image_pdf.py /path/to/folder/ -o output_dir/ --overwrite

3. 质量说明

DPI 72：基础质量，文件最小，适合快速查看和传输
DPI 100：标准质量，文件较小，适合日常使用
DPI 150：高质量，文件适中，适合高质量归档
DPI 150：推荐质量，文件大小适中，适合大多数场景（默认）

JPEG质量说明：

质量 75：较小文件，质量可接受
质量 85：推荐质量，平衡文件大小和清晰度（默认）
质量 95：高质量，文件较大，适合高质量归档

4. 批量处理说明

本技能支持批量处理多个PDF文件，适合处理整个项目文件夹或批量转换。

批量处理模式触发条件：

输入参数包含通配符（* 或 ?）
输入参数是一个已存在的目录
使用 --batch 参数强制批量模式

批量处理行为：

自动查找所有匹配的PDF文件（支持 .pdf 和 .PDF）
为每个PDF生成对应的 _image.pdf 输出文件
输出文件默认保存在输入文件同目录，可用 -o 指定输出目录
处理过程中显示进度和每个文件的结果
处理完成后显示汇总信息（成功/失败数量）

批量处理示例：

# 处理当前目录所有PDF
python scripts/pdf_to_image_pdf.py "*.pdf"

# 处理指定目录所有PDF，输出到另一个目录
python scripts/pdf_to_image_pdf.py /path/to/input/ -o /path/to/output/

# 强制批量模式（即使输入是单个文件）
python scripts/pdf_to_image_pdf.py single.pdf --batch -o output/

技术实现

本技能使用PyMuPDF (fitz) 库实现：

打开源PDF文件
遍历每一页，使用指定DPI渲染为图片
将图片转换为JPEG格式（大幅减小文件大小）
创建新的PDF文档，将每张JPEG图片插入对应页面
保存新的图片PDF文件

生成的新PDF特点：

所有文本和图形都已转为JPEG图片
无法选择和复制文本
无法编辑原始内容
保持原始页面尺寸和布局
文件大小比PNG格式小10-20倍

注意事项

转换后的PDF文件大小取决于DPI和JPEG质量设置
JPEG是有损压缩， quality<80可能有明显质量损失
图片PDF不适合需要文本搜索的场景
建议根据用途选择合适的参数：归档用DPI=150/quality=90，日常用DPI=150/quality=85（默认），快速查看用DPI=72/quality=75
处理大文件时可能需要较多内存和时间
批量处理时建议先在小批量文件上测试，确认参数和输出质量后再处理大量文件
使用 --overwrite 参数需谨慎，会覆盖已存在的输出文件

脚本说明

scripts/pdf_to_image_pdf.py 是本技能的核心脚本，负责执行PDF到图片PDF的转换。脚本使用JPEG格式，支持自定义DPI和质量参数，以适应不同质量需求。

变更日志

v2.0 (2026-05-30)

核心优化（Phase 1+2）：

输出质量优化：

默认DPI从200下调至150（文件减小34%，质量仍优秀）
禁用Alpha通道（alpha=False），文件减小20%
Pillow优化JPEG压缩（optimize=True, progressive=True），文件减小20-30%
更新默认推荐参数：DPI=150, Quality=85

元数据保留（Phase 2）：

复制原始PDF的title, author, creator, producer到输出PDF
添加keywords: 保护版本 | 不可编辑标识
更新producer字段为安全PDF转图片PDF v2.0

测试验证：

测试文件：庆阳裕龙商贸有限公司西峰区西环路南段油气合建站《LNG气瓶充装质量保证手册》(YLSM-SC-A0-2026).pdf（67页）
测试结果：输出大小从21.7MB降至14.3MB（-34%），元数据完整保留

不兼容变更：

默认DPI从200改为150（输出文件更小，质量仍优秀）

升级建议：建议所有用户升级到v2.0，获得更好的输出质量和更小的文件大小。

版本历史

共 1 个版本

v2.0.0 版本变更（v2.0） Phase 1：输出质量优化默认DPI：200 → 150（文件减小34%）禁用Alpha通道（文件减小20%） Pillow优化JPEG压缩（文件减小20-30%） Phase 2：元数据保留复制原始PDF的title/author/creator/producer 添加keywords: 保护版本 | 不可编辑当前

2026-05-30 16:53 安全安全

安全检测

腾讯云安全 (Keen)

安全，无风险

查看报告

腾讯云安全 (Sanbu)