← 返回
未分类 Key

mar-document-pro

文档处理技能 - 让 AI 能够读取、解析、提取 PDF、DOCX、PPT 等文档的关键信息,并通过 SkillBoss API Hub 进行 AI 智能分析与摘要。当用户要求分析文档、提取内容、总结报告时触发此技能。
文档处理技能:读取、解析、提取 PDF、DOCX、PPT 等文件关键信息,通过 SkillBoss API Hub 实现 AI 智能分析与摘要。用户请求分析文档、提取内容或总结报告时触发。
marjoriebroad marjoriebroad 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 需要
★ 0
Stars
📥 335
下载
💾 0
安装
1
版本
#latest

概述

Document Pro - 文档处理技能

概述

赋予 AI 强大的文档处理能力:

  • PDF 读取与提取
  • Word 文档解析
  • PowerPoint 提取
  • Excel 数据提取
  • 文档格式转换

触发场景

  1. 用户发送文档并要求"分析"、"总结"
  2. 用户要求"提取文档内容"
  3. 用户要求"转换成 PDF"
  4. 用户询问文档中的具体信息
  5. 用户要求"从报告/论文中提取要点"

支持的格式

格式读取写入工具
------------------------
PDFpdfplumber, PyPDF2
DOCXpython-docx
PPTXpython-pptx
XLSXopenpyxl
TXT内置
Markdown内置

工具使用

PDF 处理

# 提取文本
import pdfplumber

with pdfplumber.open("document.pdf") as pdf:
    for page in pdf.pages:
        text = page.extract_text()
        print(text)

# 提取表格
with pdfplumber.open("document.pdf") as pdf:
    table = pdf.pages[0].extract_tables()

Word 文档

from docx import Document

doc = Document("document.docx")
for para in doc.paragraphs:
    print(para.text)

# 提取表格
for table in doc.tables:
    for row in table.rows:
        print([cell.text for cell in row.cells])

PowerPoint

from pptx import Presentation

prs = Presentation("presentation.pptx")
for slide in prs.slides:
    for shape in slide.shapes:
        if shape.has_text_frame:
            print(shape.text)

AI 分析(通过 SkillBoss API Hub)

提取文档内容后,使用 SkillBoss API Hub 进行 AI 分析(摘要、关键词提取等):

import requests, os

SKILLBOSS_API_KEY = os.environ["SKILLBOSS_API_KEY"]
API_BASE = "https://api.heybossai.com/v1"

def pilot(body: dict) -> dict:
    r = requests.post(
        f"{API_BASE}/pilot",
        headers={"Authorization": f"Bearer {SKILLBOSS_API_KEY}", "Content-Type": "application/json"},
        json=body,
        timeout=60,
    )
    return r.json()

# 提取文档文本后,调用 SkillBoss API Hub 进行摘要分析
def analyze_document(doc_text: str) -> str:
    result = pilot({
        "type": "chat",
        "inputs": {
            "messages": [
                {"role": "system", "content": "你是文档分析助手,请提取要点并生成结构化摘要。"},
                {"role": "user", "content": f"请分析以下文档内容:\n\n{doc_text}"}
            ]
        },
        "prefer": "balanced"
    })
    return result["result"]["choices"][0]["message"]["content"]

工作流

1. 识别文档类型 → 选择正确的工具
2. 读取内容 → 提取文本、表格、图片
3. 分析信息 → 通过 SkillBoss API Hub 理解结构、提取要点
4. 总结呈现 → 用中文总结给用户

进阶功能

文档摘要

  • 提取文档主要观点
  • 生成简短摘要
  • 列出关键要点

表格处理

  • 识别表格结构
  • 提取表格数据
  • 转换为 CSV/Excel

关键词提取

  • 找出重要名词/术语
  • 识别主题
  • 提取关键信息

环境变量

SKILLBOSS_API_KEY=<your_skillboss_api_key>

输出格式

向用户呈现文档时:

  • 文档类型和页数
  • 主要内容摘要
  • 关键要点(3-5条)
  • 建议的后续操作

限制

  • 扫描版 PDF 需要 OCR
  • 复杂格式可能丢失
  • 图片/图表无法完全理解

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 21:05 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

ai-agent

Skillboss

marjoriebroad
AI 代理的瑞士军刀,50+ 模型支持图像生成、视频生成、语音合成、语音识别、音乐、聊天、网页搜索、文档解析、邮件...
★ 0 📥 692
office-efficiency

Excel / XLSX

ivangdavila
创建、检查和编辑 Microsoft Excel 工作簿及 XLSX 文件,支持可靠的公式、日期、类型、格式、重算及模板保留功能。
★ 398 📥 149,260
office-efficiency

Gog

steipete
Google Workspace 命令行工具,支持 Gmail、日历、云端硬盘、通讯录、表格和文档。
★ 937 📥 187,625