← 返回
未分类

精简PDF处理工具包

一款轻量高效的 PDF 处理工具,集成文本提取、PDF 合并、PDF 拆分、水印添加、文件信息查询、OCR 图文识别、扫描版 PDF 转文字、PDF 转 Word、PDF 转图片、PDF 转 HTML、PDF 转 TXT、PDF 转 Markdown、多张图片合成 PDF、Word 转 PDF、页面旋转、删除页码、提取页面、插入页面、替换页面、页面反转、页眉页脚、自动页码、图片提取、表格提取、书签提取、批注提取、PDF 加密、PDF 解密、文件压缩、文档修复、批量处理、批量转 Word、批量转图片、批量 Word 转 PDF 等全功能,满足办公自动化、格式转换、文档整理、扫描件处理等高频场景需求,简洁高效
user_05cc33a7
未分类 community v1.0.1 2 版本 99926.8 Key: 无需
★ 2
Stars
📥 1,326
下载
💾 265
安装
2
版本
#latest

概述

📄 PDF 终极全能处理 Skill

> 一站式 PDF 解决方案:转换、编辑、OCR、加密解密、水印、页眉页脚、批量处理


🤖 Agent 执行指令

执行本技能后,代理必须:

1. 理解用户需求

  • 识别 PDF 处理意图(转换/编辑/提取/加密/批量等)
  • 解析关键参数(文件路径、输出路径、操作选项)

2. 执行命令示例

# 基础操作
python pdf_fast_handler_skill.py info input.pdf
python pdf_fast_handler_skill.py extract input.pdf
python pdf_fast_handler_skill.py merge file1.pdf file2.pdf -o merged.pdf

# 格式转换
python pdf_fast_handler_skill.py to-word input.pdf -o output.docx
python pdf_fast_handler_skill.py to-image input.pdf -o ./images
python pdf_fast_handler_skill.py to-txt input.pdf -o output.txt
python pdf_fast_handler_skill.py to-md input.pdf -o output.md

# 页面编辑
python pdf_fast_handler_skill.py rotate input.pdf 90 -o rotated.pdf
python pdf_fast_handler_skill.py delete-pages input.pdf 1,3,5 -o output.pdf
python pdf_fast_handler_skill.py extract-pages input.pdf 1,2,3 -o output.pdf

# 安全操作
python pdf_fast_handler_skill.py encrypt input.pdf -p 123456 -o encrypted.pdf
python pdf_fast_handler_skill.py decrypt input.pdf -p 123456 -o decrypted.pdf

# 图片/Word 互转
python pdf_fast_handler_skill.py images2pdf img1.jpg img2.jpg -o output.pdf
python pdf_fast_handler_skill.py word2pdf input.docx -o output.pdf

# 批量处理
python pdf_fast_handler_skill.py batch ./pdf_folder to-word

3. 依赖安装(脚本会自动检测并提示)

pip install PyPDF2 pdf2image pillow pytesseract pdf2docx docx2pdf

注意:Windows 下还需安装:


📋 支持的命令

命令说明示例
------------------
infoPDF 信息(页数、大小、加密状态)info input.pdf
extract提取文本extract input.pdf
merge合并多个 PDFmerge f1.pdf f2.pdf -o out.pdf
split拆分 PDFsplit input.pdf 3
watermark添加文字水印watermark input.pdf "机密" -o out.pdf
to-word转 Wordto-word input.pdf -o out.docx
to-image转图片to-image input.pdf -o ./folder
to-html转 HTMLto-html input.pdf -o out.html
to-txt转 TXTto-txt input.pdf -o out.txt
to-md转 Markdownto-md input.pdf -o out.md
ocrOCR 识别(扫描件转文字)ocr input.pdf -o text.txt
encrypt加密 PDFencrypt input.pdf -p 123456
decrypt解密 PDFdecrypt input.pdf -p 123456
rotate旋转页面rotate input.pdf 90
delete-pages删除页delete-pages input.pdf 1,3,5
extract-pages提取页extract-pages input.pdf 1,2
insert-page插入 PDFinsert-page input.pdf 2 insert.pdf
replace-page替换页replace-page input.pdf 3 new.pdf
add-header添加页眉add-header input.pdf "公司名称"
add-footer添加页脚add-footer input.pdf "第几页"
add-page-num添加页码add-page-num input.pdf
extract-images提取图片extract-images input.pdf -o ./imgs
extract-bookmarks提取书签extract-bookmarks input.pdf
reverse-pages反转页面顺序reverse-pages input.pdf
compress压缩 PDFcompress input.pdf high
repair修复损坏 PDFrepair input.pdf
images2pdf图片转 PDFimages2pdf a.jpg b.jpg -o out.pdf
word2pdfWord 转 PDFword2pdf input.docx
batch批量处理batch ./folder to-word

🐛 故障排查

问题:poppler 或 tesseract 找不到

  • Windows:下载安装后添加到 PATH,或指定完整路径
  • Linuxsudo apt install poppler-utils tesseract-ocr
  • Macbrew install poppler tesseract

问题:pip 安装失败

  • 确保 Python 3.8+
  • 尝试:pip install --upgrade pip

📝 更新日志

  • v1.0.0:初始版本,支持完整 PDF 处理功能

版本历史

共 2 个版本

  • v1.0.1 Initial release 当前
    2026-04-09 09:02 安全 安全
  • v1.0.0 Initial release
    2026-04-08 15:14 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

角色个性管理

user_05cc33a7
本技能是一套用于灵活定制、修改与深度重塑 Claw 对话人格的角色管理系统。它支持从预设角色库中读取完整人设信息,快四切换 Claw 的语言风格、语气习惯、思维方式与角色气质,将当前对话人格完全覆盖并固化为指定角色。同时支持角色保存、路径记
★ 0 📥 154

硬件电子元件速查助手

user_05cc33a7
为专业级电子元件综合处理工具,集成丝印反查、型号查询、参数解析、Datasheet 获取、阻值计算、容值换算、电感计算、色环解析、E96 精密电阻查询、LED 限流电阻计算、分压电路计算、RC/RL/LC 滤波计算、PCB 载流估算、串并联
★ 0 📥 815

局域网资源分发助手

user_05cc33a7
局域网二维码文件共享工具。提供主站网关、单文件直传、从站自动发现三大模式。一键生成访问二维码,手机平板电脑扫码即连,无需互联网跨设备传输。支持文件上传下载、在线预览与目录列表管理。内置局域网设备自动发现,秒级查找可用共享源。支持文件类型白名
★ 0 📥 140