← 返回
未分类

Cn Pdf Assistant

PDF文档处理工具。本地处理PDF文件,支持文本提取、智能摘要、表格导出、关键词问答、PDF拆分。纯本地处理,保护文档隐私。
本地PDF处理工具(含OCR),支持文本提取、智能摘要、表格导出、关键词问答、PDF拆分和扫描识别,保障隐私安全。
freedompixels freedompixels 来源
未分类 clawhub v1.3.0 3 版本 99910.6 Key: 无需
★ 0
Stars
📥 1,118
下载
💾 1
安装
3
版本
#assistant#chinese#document#latest#pdf#productivity

概述

功能

  • PDF文本提取(支持指定页码范围)
  • 智能摘要生成(章节标题识别+关键词频率分析)
  • 表格提取(pdfplumber引擎)
  • 关键词问答(基于段落匹配)
  • PDF按页拆分
  • OCR扫描版识别(v1.3.0新增,支持中英文扫描版PDF)
  • 纯本地处理,无需联网

使用方法

python3 scripts/pdf_assistant.py <PDF文件路径> --action text
python3 scripts/pdf_assistant.py <PDF文件路径> --action summary
python3 scripts/pdf_assistant.py <PDF文件路径> --action tables
python3 scripts/pdf_assistant.py <PDF文件路径> --action ask --question "关键词"
python3 scripts/pdf_assistant.py <PDF文件路径> --action split
python3 scripts/pdf_assistant.py <PDF文件路径> --action ocr  # v1.3.0新增

依赖

  • Python 3.7+
  • PyPDF2, pdfplumber, pandas, openpyxl
  • OCR功能依赖: pdf2image, pytesseract, Pillow, Tesseract-OCR(可选,未安装时OCR功能不可用)

权限声明

  • 读取本地PDF文件
  • 生成输出文件

使用场景

  • 论文阅读:快速提取核心内容
  • 合同审查:提取关键条款
  • 财报分析:提取表格数据
  • 资料整理:批量拆分PDF文档
  • 扫描版PDF识别:将扫描版PDF转为可搜索文本(v1.3.0新增)

v1.3.0 更新日志

  • ✅ 新增OCR功能(--action ocr
  • ✅ 支持中英文扫描版PDF识别
  • ✅ 自动保存OCR结果为TXT文件
  • ✅ 显示OCR置信度评分

出品: AISoBrand|爱索品牌 — AI搜索优化工具

官网: https://aisobrand.com

免费检测你的品牌在AI搜索中有没有存在感 → 30秒出结果

版本历史

共 3 个版本

  • v1.3.0 当前
    2026-06-11 23:10
  • v1.2.8
    2026-06-07 12:05 安全
  • v1.2.5
    2026-05-03 07:45 安全 安全

安全检测

腾讯云安全 (Keen)

队列中

腾讯云安全 (Sanbu)

队列中

🔗 相关推荐

Cn Meeting Minutes

freedompixels
会议纪要生成工具:输入会议录音,自动生成包含关键讨论、决策结论、待办事项的结构化Markdown文档。
★ 0 📥 1,375

6大平台热搜聚合

freedompixels
聚合全平台热搜,一键获取知乎、微博、百度、B站、抖音、头条六大平台热榜。无需API Key,开箱即用。触发词:热搜、热点、今日热点、什么火、热搜榜、全平台热搜、趋势。
★ 1 📥 1,130

Feishu Daily Report

freedompixels
飞书日报/周报自动生成:从飞书文档、聊天记录、Bitable等自动汇总生成结构化报告并发送至文档或群聊。触发词:生成日报、写周报、汇总今天工作、整理飞书内容发日报、自动发日报、定时生成报告。关键词:日报、周报、日报生成、自动。
★ 0 📥 1,363