概述

📝 Summarize — 文档与网页智能总结技能

技能定位

本技能用于对各类文档和网页内容进行结构化智能总结，将长篇内容压缩为精炼的要点摘要，帮助用户快速把握核心信息。

触发条件

满足以下任一场景时激活本技能：

用户发送 URL，请求"总结这个页面"或"摘要"
用户上传/指定文件（PDF / MD / TXT），要求提取要点
用户粘贴大段文本，请求"帮我总结"
用户使用 /summarize 命令

支持的内容类型

类型	来源	处理方式
------	------	----------
网页 / HTML	URL	`WebFetch` 提取正文，`scripts/clean_html.py` 清洗
PDF 文件	本地路径	`scripts/extract_pdf.py` 提取文本
Markdown	本地路径	`Read` 工具直接读取
纯文本 TXT	本地路径	`Read` 工具直接读取
代码片段	对话中粘贴	直接分析文本内容

核心工作流

第一步：获取内容

网页内容：

使用 WebFetch 获取页面 HTML
调用 scripts/clean_html.py 去除广告、导航栏等干扰元素
提取纯文本正文

本地文件：

根据文件扩展名选择提取方式

.pdf → scripts/extract_pdf.py（需 pip install pypdf）
.md / .txt → Read 工具直接读取

对话文本：

直接使用用户提供的文本内容

第二步：内容分析

对提取的纯文本进行以下维度的分析：

主题识别：一句话描述内容主题
结构拆分：识别文档的章节/段落结构
关键实体：提取人名、地名、机构名、术语
核心观点：提炼每个段落/章节的主要论点
数据/事实：提取数字、日期、统计数据等硬信息
结论/行动项：识别文末结论、建议、待办

第三步：生成摘要

根据内容长度和类型，生成相应格式的摘要：

短内容（< 2000 字）： 生成一句话概要 + 3~5 个要点

中等长度（2000~10000 字）： 生成简要 + 分章节摘要 + 关键数据表格

长篇内容（> 10000 字）： 生成执行摘要 + 分章节要点 + 核心结论 + 推荐阅读部分

第四步：格式化输出

使用 references/summary_templates.md 中的模板格式化输出，保持一致性。

摘要质量标准

✅ 完整性：覆盖原文所有重要主题，无关键信息遗漏

✅ 准确性：忠实原文，不添加外部推断或臆测

✅ 简洁性：用最少的字表达最核心的信息

✅ 可读性：结构清晰，语言流畅，避免堆砌术语

✅ 可操作性：若原文含行动建议，摘要中需保留

输出格式

# 📄 内容摘要

**来源**：[URL / 文件路径]
**类型**：网页 / PDF / Markdown / 纯文本
**原文字数**：约 XXXX 字
**总结生成时间**：YYYY-MM-DD HH:mm

---

## 🎯 一句话概要
（用一句话概括全文核心，帮助用户决定是否深入阅读）

---

## 📌 核心要点

1. **要点1**：说明...
2. **要点2**：说明...
3. **要点3**：说明...
   [...继续列出5~10个核心要点]

---

## 📊 关键信息

| 项目 | 内容 |
|------|------|
| 关键数据1 | XXXX |
| 关键数据2 | XXXX |
| ... | ... |

---

## 🔍 详细内容（可选折叠）

### 章节A
（该部分的详细摘要）

### 章节B
（该部分的详细摘要）

---

## 💡 结论与建议
（文末结论、作者观点、可行动项）

---

*本摘要由 AI 自动生成，如有关键信息遗漏请指出。*

错误处理

场景	处理方式
------	----------
URL 无法访问	提示用户检查链接有效性，尝试提供页面截图或文本
PDF 提取失败	建议用户将 PDF 内容复制为文本，或转为 Markdown 格式
内容为空	告知用户页面可能需要登录或内容被保护，建议手动复制
内容过短（<100字）	直接输出原文并标注"内容过短，无需总结"
页面为纯图片/视频	提示当前技能无法处理，建议描述页面内容后手动总结

示例对话

用户：帮我总结一下这篇文章：https://example.com/tech-article

助手：好的，让我获取并分析这篇内容...

[执行工作流] → 输出结构化摘要

用户：把这个PDF文件总结一下：C:\Docs\report.pdf

助手：正在提取PDF内容... → [执行工作流] → 输出结构化摘要

用户：太长了，能给我一个简短的版本吗？

助手：好的，以下是精简版摘要...

[输出一句话概要 + 3个核心要点]

版本历史

共 1 个版本

v1.0.0 Initial release 当前

2026-05-17 17:34 安全安全

安全检测

腾讯云安全 (Keen)

安全，无风险

查看报告

腾讯云安全 (Sanbu)