← 返回
未分类

Document Summarize

当用户要求"总结"、"摘要"、"提炼要点"、"提取关键信息",或提供 URL、文件路径希望生成内容概览时,应使用本技能。支持网页(HTML)、PDF、Markdown、TXT 等格式。
当用户要求"总结"、"摘要"、"提炼要点"、"提取关键信息",或提供 URL、文件路径希望生成内容概览时,应使用本技能。支持网页(HTML)、PDF、Markdown、TXT 等格式。
user_7eecc4ea
未分类 community v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 101
下载
💾 0
安装
1
版本
#latest

概述

📝 Summarize — 文档与网页智能总结技能

技能定位

本技能用于对各类文档和网页内容进行结构化智能总结,将长篇内容压缩为精炼的要点摘要,帮助用户快速把握核心信息。


触发条件

满足以下任一场景时激活本技能:

  • 用户发送 URL,请求"总结这个页面"或"摘要"
  • 用户上传/指定文件(PDF / MD / TXT),要求提取要点
  • 用户粘贴大段文本,请求"帮我总结"
  • 用户使用 /summarize 命令

支持的内容类型

类型来源处理方式
----------------------
网页 / HTMLURLWebFetch 提取正文,scripts/clean_html.py 清洗
PDF 文件本地路径scripts/extract_pdf.py 提取文本
Markdown本地路径Read 工具直接读取
纯文本 TXT本地路径Read 工具直接读取
代码片段对话中粘贴直接分析文本内容

核心工作流

第一步:获取内容

网页内容:

  1. 使用 WebFetch 获取页面 HTML
  2. 调用 scripts/clean_html.py 去除广告、导航栏等干扰元素
  3. 提取纯文本正文

本地文件:

  1. 根据文件扩展名选择提取方式
    • .pdfscripts/extract_pdf.py(需 pip install pypdf
    • .md / .txtRead 工具直接读取

对话文本:

  1. 直接使用用户提供的文本内容

第二步:内容分析

对提取的纯文本进行以下维度的分析:

  1. 主题识别:一句话描述内容主题
  2. 结构拆分:识别文档的章节/段落结构
  3. 关键实体:提取人名、地名、机构名、术语
  4. 核心观点:提炼每个段落/章节的主要论点
  5. 数据/事实:提取数字、日期、统计数据等硬信息
  6. 结论/行动项:识别文末结论、建议、待办

第三步:生成摘要

根据内容长度和类型,生成相应格式的摘要:

短内容(< 2000 字): 生成一句话概要 + 3~5 个要点

中等长度(2000~10000 字): 生成简要 + 分章节摘要 + 关键数据表格

长篇内容(> 10000 字): 生成执行摘要 + 分章节要点 + 核心结论 + 推荐阅读部分

第四步:格式化输出

使用 references/summary_templates.md 中的模板格式化输出,保持一致性。


摘要质量标准

完整性:覆盖原文所有重要主题,无关键信息遗漏

准确性:忠实原文,不添加外部推断或臆测

简洁性:用最少的字表达最核心的信息

可读性:结构清晰,语言流畅,避免堆砌术语

可操作性:若原文含行动建议,摘要中需保留


输出格式

# 📄 内容摘要

**来源**:[URL / 文件路径]
**类型**:网页 / PDF / Markdown / 纯文本
**原文字数**:约 XXXX 字
**总结生成时间**:YYYY-MM-DD HH:mm

---

## 🎯 一句话概要
(用一句话概括全文核心,帮助用户决定是否深入阅读)

---

## 📌 核心要点

1. **要点1**:说明...
2. **要点2**:说明...
3. **要点3**:说明...
   [...继续列出5~10个核心要点]

---

## 📊 关键信息

| 项目 | 内容 |
|------|------|
| 关键数据1 | XXXX |
| 关键数据2 | XXXX |
| ... | ... |

---

## 🔍 详细内容(可选折叠)

### 章节A
(该部分的详细摘要)

### 章节B
(该部分的详细摘要)

---

## 💡 结论与建议
(文末结论、作者观点、可行动项)

---

*本摘要由 AI 自动生成,如有关键信息遗漏请指出。*

错误处理

场景处理方式
----------------
URL 无法访问提示用户检查链接有效性,尝试提供页面截图或文本
PDF 提取失败建议用户将 PDF 内容复制为文本,或转为 Markdown 格式
内容为空告知用户页面可能需要登录或内容被保护,建议手动复制
内容过短(<100字)直接输出原文并标注"内容过短,无需总结"
页面为纯图片/视频提示当前技能无法处理,建议描述页面内容后手动总结

示例对话

用户:帮我总结一下这篇文章:https://example.com/tech-article

助手:好的,让我获取并分析这篇内容...

[执行工作流] → 输出结构化摘要

用户:把这个PDF文件总结一下:C:\Docs\report.pdf

助手:正在提取PDF内容... → [执行工作流] → 输出结构化摘要

用户:太长了,能给我一个简短的版本吗?

助手:好的,以下是精简版摘要...

[输出一句话概要 + 3个核心要点]

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-05-17 17:34 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

knowledge-management

Obsidian

steipete
操作 Obsidian 仓库(纯 Markdown 笔记)并通过 obsidian-cli 自动化。
★ 447 📥 105,600
knowledge-management

web-tools-guide

user_ec205dbb
MANDATORY before calling web_search, web_fetch, browser, or opencli. Contains required error-handling procedures (web_se
★ 81 📥 166,439
knowledge-management

Baidu web search

ide-rea
使用百度AI搜索引擎(BDSE)进行网络搜索。适用于获取实时信息、文档资料或研究课题。
★ 246 📥 108,591