将 kb-inventory-update 技能筛选出的 A 类资料,批量转化为可复用的知识卡片。核心价值在于:把"知道哪些重要"变成"已经吸收了"。
输入:processed_kb_items_latest.json(由 kb-inventory-update 生成)
输出:knowledge_cards/ 目录下的结构化知识卡片 + 更新后的 processed_kb_items_latest.json(output_status 升级)
| 入口 | 用户表述 | 说明 |
|---|---|---|
| ------ | --------- | ------ |
| 全量 | "消化全部A类资料"、"批量生成知识卡片" | 处理所有A类(建议加 --top 10 限制批次) |
| 主题 | "消化Codex相关的"、"消化Seedance的" | 按主题/关键词过滤A类 |
| 新增 | "消化新增的A类资料"、"消化上次新增的" | 仅处理 status=未处理 且最近新增的A类 |
| 模式 | 参数 | 数据来源 | 卡片深度 | 适合场景 |
|---|---|---|---|---|
| :--: | :--: | -------- | :--: | -------- |
| 速览(默认) | 无 | 标题 + 搜索摘要 + 可用内容读取工具摘要 | 标题 + 一句话总结 + 核心观点(3-5条)+ 可转化方向 | 快速过一遍、筛选值得精读的 |
| 精读 | --deep | 可用内容读取工具拉取全文/视频完整分析 | 速览内容 + 详细方法论 + 可应用场景 + 关联资料 + 原文关键引用 | 高价值资料深度消化 |
默认使用速览模式。用户明确说"精读"时才用 deep 模式。每批建议不超过 5-10 条。
Phase 1: 筛选清单 → Phase 2: 逐条消化 → Phase 3: 保存卡片+更新状态
python3 skills/kb-auto-digester/scripts/prepare_digest_list.py \
--input processed_kb_items_latest.json \
--output digest_queue.json \
[--mode new|theme|all] \
[--theme "Codex"] \
[--top 10]
参数说明:
--mode new:仅处理 output_status=未处理 的A类--mode theme --theme "Codex":按关键词过滤主题--mode all --top 10:全量A类,限制批次数量--mode new --top 5输出 digest_queue.json,包含待消化清单及每条的 media_id、media_type、摘要等,方便 Phase 2 直接读取。
> ⚠️ 这是核心步骤,由 AI 按以下规则逐条处理,不得跳过。
对 digest_queue 中的每条资料,按深度模式执行:
finalize_digest.py 或手动维护索引,将对应资料状态更新为“已提炼”finalize_digest.py 或手动维护索引,将对应资料状态更新为“已提炼”当资料类型为视频(media_type=video/YouTube/B站,或 URL 指向视频平台)时:
```
"请完整分析这段视频:① 视频主题和核心观点 ② 展示的具体操作步骤(如有分步骤) ③ 作者演示的技巧/工具/参数配置 ④ 视频中提到的任何设置参数/数值/公式 ⑤ 案例展示的结果和数据 ⑥ 视频的分段结构(开头→中间→结尾讲了什么)。如果是教程类视频,提取每个操作步骤的详细说明。"
```
python3 skills/kb-auto-digester/scripts/finalize_digest.py \
--queue digest_queue.json \
--cards-dir knowledge_cards/ \
--data processed_kb_items_latest.json \
--update-status
此脚本会:
未处理 → 已提炼# 📝 {标题}
**标签**:{一级/二级/三级}
**来源**:{知识库名} | {资料类型}
**深度**:速览
## 一句话总结
{1句话}
## 核心观点
1. ...
2. ...
3. ...
## 适合人群
{谁需要看这个}
## 可转化方向
- {可转化为的成果类型}
## 关键词
{3-5个关键词}
# 📖 {标题}
**标签**:{一级/二级/三级}
**来源**:{知识库名} | {资料类型} | [原文链接]
**深度**:精读
## 一句话总结
{1句话}
## 核心方法论
1. ...
2. ...
3. ...
## 操作指南 / 步骤
| 步骤 | 说明 | 关键参数/工具 |
|------|------|-------------|
| 1 | ... | ... |
## 关键数据 / 案例
- {引用的数据或案例}
## 我的理解与可应用场景
{结合用户场景的理解}
## 可转化成果
- {具体可产出的成果}
## 关联资料
- {知识库中相关条目}
## 关键词
{3-5个}
在 kb-inventory-update 报告末尾,自动追加上一次消化后的待处理提示(由 generate_report.py 的转化漏斗处理):
> 💡 当前 72条 A 类中,68条待消化。回复"消化新增的A类资料"开始批量处理。
此提示已集成在 kb-inventory-update 的「成果转化漏斗」章节中,无需额外改动。
每批次完成后输出:
| 异常 | 处理 |
|---|---|
| ------ | ------ |
| 资料无法读取全文 | 标记为"读取失败",降级用摘要生成速览卡片 |
| 视频内容分析不完整 | 第二次读取/分析时更换问题视角(从“教程”视角改为“工具评测”视角重试) |
| A 类过大(>30条) | 强制分批次,每批 ≤ 10 条 |
| processed 数据缺少字段 | 自动补全默认值 |
prepare_digest_list.py — 筛选 A 类清单,输出待消化队列 JSONfinalize_digest.py — 保存知识卡片,更新 output_statusknowledge_card_quick.md — 速览卡片模板knowledge_card_deep.md — 精读卡片模板共 2 个版本