← 返回
效率工具 中文

Pdfreader

Extract text and metadata from PDF files using PyMuPDF, supporting large files and outputting results in JSON format.
使用 PyMuPDF 从 PDF 文件中提取文本和元数据,支持大文件并以 JSON 格式输出结果。
nantes
效率工具 clawhub v1.0.3 1 版本 99757.7 Key: 无需
★ 2
Stars
📥 1,195
下载
💾 172
安装
1
版本
#latest

概述

PDF Reader Skill for OpenClaw

Extract and read text from PDF files using PyMuPDF.

Installation

pip install pymupdf

Usage

# Extract text (first 10 pages by default)
python pdf_reader.py "path/to/file.pdf" 10

# Output to JSON file (for reading)
python pdf_reader.py "path/to/file.pdf" 10 --output=extracted.json

# Read specific number of pages
python pdf_reader.py "path/to/file.pdf" 5

Features

  • Extracts text from any PDF
  • Supports large files
  • Outputs JSON for AI reading
  • Handles encoding issues
  • Shows metadata (title, author, etc.)

Security Restrictions

For safety, the script enforces:

  • Input files: Must be .pdf files within the current working directory
  • Output files: Must be .json files within the current working directory
  • No path traversal (../) allowed
  • Files can only be read/written in the directory where the script runs

Files

  • pdf_reader.py - Main Python script
  • SKILL.md - This documentation

版本历史

共 1 个版本

  • v1.0.3 当前
    2026-03-29 09:51 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

productivity

Word / DOCX

ivangdavila
创建、检查和编辑 Microsoft Word 文档及 DOCX 文件,支持样式、编号、修订记录、表格、分节符及兼容性检查等功能。
★ 438 📥 147,377
productivity

Nano Pdf

steipete
使用nano-pdf CLI通过自然语言指令编辑PDF
★ 275 📥 114,781
developer-tools

Mcp Client

nantes
模型上下文协议(MCP)客户端 - 连接工具、数据源和服务
★ 1 📥 2,812