概述

知识库A类自动消化 Skill

概述

将 kb-inventory-update 技能筛选出的 A 类资料，批量转化为可复用的知识卡片。核心价值在于：把"知道哪些重要"变成"已经吸收了"。

输入：processed_kb_items_latest.json（由 kb-inventory-update 生成）

输出：knowledge_cards/ 目录下的结构化知识卡片 + 更新后的 processed_kb_items_latest.json（output_status 升级）

触发方式

三种入口

入口	用户表述	说明
------	---------	------
全量	"消化全部A类资料"、"批量生成知识卡片"	处理所有A类（建议加 `--top 10` 限制批次）
主题	"消化Codex相关的"、"消化Seedance的"	按主题/关键词过滤A类
新增	"消化新增的A类资料"、"消化上次新增的"	仅处理 status=未处理且最近新增的A类

两种深度

模式	参数	数据来源	卡片深度	适合场景
:--:	:--:	--------	:--:	--------
速览（默认）	无	标题 + 搜索摘要 + 可用内容读取工具摘要	标题 + 一句话总结 + 核心观点（3-5条）+ 可转化方向	快速过一遍、筛选值得精读的
精读	`--deep`	可用内容读取工具拉取全文/视频完整分析	速览内容 + 详细方法论 + 可应用场景 + 关联资料 + 原文关键引用	高价值资料深度消化

默认使用速览模式。用户明确说"精读"时才用 deep 模式。每批建议不超过 5-10 条。

工作流程

Phase 1: 筛选清单 → Phase 2: 逐条消化 → Phase 3: 保存卡片+更新状态

Phase 1：筛选 A 类清单

python3 skills/kb-auto-digester/scripts/prepare_digest_list.py \
    --input processed_kb_items_latest.json \
    --output digest_queue.json \
    [--mode new|theme|all] \
    [--theme "Codex"] \
    [--top 10]

参数说明：

--mode new：仅处理 output_status=未处理的A类
--mode theme --theme "Codex"：按关键词过滤主题
--mode all --top 10：全量A类，限制批次数量
默认 --mode new --top 5

输出 digest_queue.json，包含待消化清单及每条的 media_id、media_type、摘要等，方便 Phase 2 直接读取。

Phase 2：逐条消化（AI 驱动）

> ⚠️ 这是核心步骤，由 AI 按以下规则逐条处理，不得跳过。

对 digest_queue 中的每条资料，按深度模式执行：

速览模式（默认）

使用当前平台可用的内容读取方式获取资料内容，例如本地文件读取、网页抓取、知识库检索、平台 fetch 工具或用户粘贴原文：

知识库资料（media_id）：使用平台知识库读取/检索能力，提取一句话核心内容、3-5 个关键观点、适合人群和可操作方法。
笔记（note_id）：使用平台笔记读取能力，按同一问题提取摘要和关键观点。
URL：使用网页读取能力或让用户提供网页正文，再提取摘要和关键观点。

基于读取结果，生成初级知识卡片（模板见 templates/knowledge_card_quick.md）

使用 finalize_digest.py 或手动维护索引，将对应资料状态更新为“已提炼”

精读模式（--deep）

使用当前平台可用的内容读取方式获取完整原文：

针对 media_id / URL / 本地文件读取全文，并提取全文核心论点、分章节方法论、操作步骤、关键数据/案例以及与同类资料的区别点。

视频专项规则（见下方 §视频内容处理）

基于完整内容，生成深度知识卡片（模板见 templates/knowledge_card_deep.md）

使用 finalize_digest.py 或手动维护索引，将对应资料状态更新为“已提炼”

📹 视频内容专项处理规则

当资料类型为视频（media_type=video/YouTube/B站，或 URL 指向视频平台）时：

读取视频资料时必须使用视频分析专用问题：

```

"请完整分析这段视频：① 视频主题和核心观点 ② 展示的具体操作步骤（如有分步骤） ③ 作者演示的技巧/工具/参数配置 ④ 视频中提到的任何设置参数/数值/公式 ⑤ 案例展示的结果和数据 ⑥ 视频的分段结构（开头→中间→结尾讲了什么）。如果是教程类视频，提取每个操作步骤的详细说明。"

```

标记视频时间戳：如原文提供时间戳，卡片中保留关键步骤对应的时间点。

操作类视频：生成的知识卡片必须包含「操作清单」小节，逐步骤列出，确保可复现。

演示类视频：重点提取工具/参数配置，卡片中单列「工具与参数」小节。

案例类视频：重点提取案例背景→做法→结果→可迁移点。

Phase 3：保存卡片 + 更新状态

python3 skills/kb-auto-digester/scripts/finalize_digest.py \
    --queue digest_queue.json \
    --cards-dir knowledge_cards/ \
    --data processed_kb_items_latest.json \
    --update-status

此脚本会：

将 Phase 2 生成的知识卡片文件注册到 processed 数据中
更新已消化资料的 output_status：未处理 → 已提炼
已消化的资料下次不再出现在 new 模式中

知识卡片模板

速览卡片（quick）

# 📝 {标题}

**标签**：{一级/二级/三级}
**来源**：{知识库名} | {资料类型}
**深度**：速览

## 一句话总结
{1句话}

## 核心观点
1. ...
2. ...
3. ...

## 适合人群
{谁需要看这个}

## 可转化方向
- {可转化为的成果类型}

## 关键词
{3-5个关键词}

精读卡片（deep）

# 📖 {标题}

**标签**：{一级/二级/三级}
**来源**：{知识库名} | {资料类型} | [原文链接]
**深度**：精读

## 一句话总结
{1句话}

## 核心方法论
1. ...
2. ...
3. ...

## 操作指南 / 步骤
| 步骤 | 说明 | 关键参数/工具 |
|------|------|-------------|
| 1   | ...  | ...          |

## 关键数据 / 案例
- {引用的数据或案例}

## 我的理解与可应用场景
{结合用户场景的理解}

## 可转化成果
- {具体可产出的成果}

## 关联资料
- {知识库中相关条目}

## 关键词
{3-5个}

衔接 kb-inventory-update

在 kb-inventory-update 报告末尾，自动追加上一次消化后的待处理提示（由 generate_report.py 的转化漏斗处理）：

> 💡 当前 72条 A 类中，68条待消化。回复"消化新增的A类资料"开始批量处理。

此提示已集成在 kb-inventory-update 的「成果转化漏斗」章节中，无需额外改动。

输出摘要

每批次完成后输出：

本批消化条数 + 深度模式
卡片保存路径
已更新为"已提炼"的条目
剩余待消化 A 类数量
下一批建议（自动提示可继续的主题方向）

异常处理

异常	处理
------	------
资料无法读取全文	标记为"读取失败"，降级用摘要生成速览卡片
视频内容分析不完整	第二次读取/分析时更换问题视角（从“教程”视角改为“工具评测”视角重试）
A 类过大（>30条）	强制分批次，每批 ≤ 10 条
processed 数据缺少字段	自动补全默认值

资源目录

scripts/

prepare_digest_list.py — 筛选 A 类清单，输出待消化队列 JSON
finalize_digest.py — 保存知识卡片，更新 output_status

templates/

knowledge_card_quick.md — 速览卡片模板
knowledge_card_deep.md — 精读卡片模板

版本历史

共 2 个版本

v1.0.1 Initial release 当前

2026-06-03 14:55 安全安全
v1.0.0 Initial release

2026-06-02 21:23 安全安全

安全检测

腾讯云安全 (Keen)

安全，无风险

查看报告

腾讯云安全 (Sanbu)