← 返回
未分类

kb-auto-digester

批量消化 A 类知识库资料,生成知识卡片并更新产出状态。Use when digesting A-grade items, generating knowledge cards, processing high-value saved resources, or updating output_status.
批量消化 A 类知识库资料,生成知识卡片并更新产出状态。Use when digesting A-grade items, generating knowledge cards, processing high-value saved resources, or updating output_status.
sullior
未分类 community v1.0.1 2 版本 100000 Key: 无需
★ 0
Stars
📥 22
下载
💾 0
安装
2
版本
#latest

概述

知识库A类自动消化 Skill

概述

kb-inventory-update 技能筛选出的 A 类资料,批量转化为可复用的知识卡片。核心价值在于:把"知道哪些重要"变成"已经吸收了"。

输入:processed_kb_items_latest.json(由 kb-inventory-update 生成)

输出:knowledge_cards/ 目录下的结构化知识卡片 + 更新后的 processed_kb_items_latest.json(output_status 升级)


触发方式

三种入口

入口用户表述说明
---------------------
全量"消化全部A类资料"、"批量生成知识卡片"处理所有A类(建议加 --top 10 限制批次)
主题"消化Codex相关的"、"消化Seedance的"按主题/关键词过滤A类
新增"消化新增的A类资料"、"消化上次新增的"仅处理 status=未处理 且最近新增的A类

两种深度

模式参数数据来源卡片深度适合场景
:--::--:--------:--:--------
速览(默认)标题 + 搜索摘要 + 可用内容读取工具摘要标题 + 一句话总结 + 核心观点(3-5条)+ 可转化方向快速过一遍、筛选值得精读的
精读--deep可用内容读取工具拉取全文/视频完整分析速览内容 + 详细方法论 + 可应用场景 + 关联资料 + 原文关键引用高价值资料深度消化

默认使用速览模式。用户明确说"精读"时才用 deep 模式。每批建议不超过 5-10 条。


工作流程

Phase 1: 筛选清单 → Phase 2: 逐条消化 → Phase 3: 保存卡片+更新状态

Phase 1:筛选 A 类清单

python3 skills/kb-auto-digester/scripts/prepare_digest_list.py \
    --input processed_kb_items_latest.json \
    --output digest_queue.json \
    [--mode new|theme|all] \
    [--theme "Codex"] \
    [--top 10]

参数说明

  • --mode new:仅处理 output_status=未处理 的A类
  • --mode theme --theme "Codex":按关键词过滤主题
  • --mode all --top 10:全量A类,限制批次数量
  • 默认 --mode new --top 5

输出 digest_queue.json,包含待消化清单及每条的 media_id、media_type、摘要等,方便 Phase 2 直接读取。

Phase 2:逐条消化(AI 驱动)

> ⚠️ 这是核心步骤,由 AI 按以下规则逐条处理,不得跳过。

对 digest_queue 中的每条资料,按深度模式执行:

速览模式(默认)

  1. 使用当前平台可用的内容读取方式获取资料内容,例如本地文件读取、网页抓取、知识库检索、平台 fetch 工具或用户粘贴原文:
    • 知识库资料(media_id):使用平台知识库读取/检索能力,提取一句话核心内容、3-5 个关键观点、适合人群和可操作方法。
    • 笔记(note_id):使用平台笔记读取能力,按同一问题提取摘要和关键观点。
    • URL:使用网页读取能力或让用户提供网页正文,再提取摘要和关键观点。
  1. 基于读取结果,生成初级知识卡片(模板见 templates/knowledge_card_quick.md)
  1. 使用 finalize_digest.py 或手动维护索引,将对应资料状态更新为“已提炼”

精读模式(--deep)

  1. 使用当前平台可用的内容读取方式获取完整原文
    • 针对 media_id / URL / 本地文件读取全文,并提取全文核心论点、分章节方法论、操作步骤、关键数据/案例以及与同类资料的区别点。
  1. 视频专项规则(见下方 §视频内容处理)
  1. 基于完整内容,生成深度知识卡片(模板见 templates/knowledge_card_deep.md)
  1. 使用 finalize_digest.py 或手动维护索引,将对应资料状态更新为“已提炼”

📹 视频内容专项处理规则

当资料类型为视频(media_type=video/YouTube/B站,或 URL 指向视频平台)时:

  1. 读取视频资料时必须使用视频分析专用问题

```

"请完整分析这段视频:① 视频主题和核心观点 ② 展示的具体操作步骤(如有分步骤) ③ 作者演示的技巧/工具/参数配置 ④ 视频中提到的任何设置参数/数值/公式 ⑤ 案例展示的结果和数据 ⑥ 视频的分段结构(开头→中间→结尾讲了什么)。如果是教程类视频,提取每个操作步骤的详细说明。"

```

  1. 标记视频时间戳:如原文提供时间戳,卡片中保留关键步骤对应的时间点。
  1. 操作类视频:生成的知识卡片必须包含「操作清单」小节,逐步骤列出,确保可复现。
  1. 演示类视频:重点提取工具/参数配置,卡片中单列「工具与参数」小节。
  1. 案例类视频:重点提取案例背景→做法→结果→可迁移点。

Phase 3:保存卡片 + 更新状态

python3 skills/kb-auto-digester/scripts/finalize_digest.py \
    --queue digest_queue.json \
    --cards-dir knowledge_cards/ \
    --data processed_kb_items_latest.json \
    --update-status

此脚本会:

  1. 将 Phase 2 生成的知识卡片文件注册到 processed 数据中
  2. 更新已消化资料的 output_status:未处理已提炼
  3. 已消化的资料下次不再出现在 new 模式中

知识卡片模板

速览卡片(quick)

# 📝 {标题}

**标签**:{一级/二级/三级}
**来源**:{知识库名} | {资料类型}
**深度**:速览

## 一句话总结
{1句话}

## 核心观点
1. ...
2. ...
3. ...

## 适合人群
{谁需要看这个}

## 可转化方向
- {可转化为的成果类型}

## 关键词
{3-5个关键词}

精读卡片(deep)

# 📖 {标题}

**标签**:{一级/二级/三级}
**来源**:{知识库名} | {资料类型} | [原文链接]
**深度**:精读

## 一句话总结
{1句话}

## 核心方法论
1. ...
2. ...
3. ...

## 操作指南 / 步骤
| 步骤 | 说明 | 关键参数/工具 |
|------|------|-------------|
| 1   | ...  | ...          |

## 关键数据 / 案例
- {引用的数据或案例}

## 我的理解与可应用场景
{结合用户场景的理解}

## 可转化成果
- {具体可产出的成果}

## 关联资料
- {知识库中相关条目}

## 关键词
{3-5个}

衔接 kb-inventory-update

在 kb-inventory-update 报告末尾,自动追加上一次消化后的待处理提示(由 generate_report.py 的转化漏斗处理):

> 💡 当前 72条 A 类中,68条待消化。回复"消化新增的A类资料"开始批量处理。

此提示已集成在 kb-inventory-update 的「成果转化漏斗」章节中,无需额外改动。


输出摘要

每批次完成后输出:

  1. 本批消化条数 + 深度模式
  2. 卡片保存路径
  3. 已更新为"已提炼"的条目
  4. 剩余待消化 A 类数量
  5. 下一批建议(自动提示可继续的主题方向)

异常处理

异常处理
------------
资料无法读取全文标记为"读取失败",降级用摘要生成速览卡片
视频内容分析不完整第二次读取/分析时更换问题视角(从“教程”视角改为“工具评测”视角重试)
A 类过大(>30条)强制分批次,每批 ≤ 10 条
processed 数据缺少字段自动补全默认值

资源目录

scripts/

  • prepare_digest_list.py — 筛选 A 类清单,输出待消化队列 JSON
  • finalize_digest.py — 保存知识卡片,更新 output_status

templates/

  • knowledge_card_quick.md — 速览卡片模板
  • knowledge_card_deep.md — 精读卡片模板

版本历史

共 2 个版本

  • v1.0.1 Initial release 当前
    2026-06-03 14:55 安全 安全
  • v1.0.0 Initial release
    2026-06-02 21:23 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

private-knowledge-base-organizer

user_99b045d5
整理收藏资料、网址、笔记、视频、PDF、文档并转化为私有知识库索引、知识卡片、成果卡片和复盘机制。Use when organizing saved resources, building a personal knowledge base
★ 0 📥 41

ima-kb-connector

user_99b045d5
连接并扫描 IMA 知识库,导出标准化资料清单。Use when the user needs to scan IMA knowledge bases, export IMA resources, or prepare scan_resul
★ 0 📥 25

kb-synthesizer

user_99b045d5
跨资料聚类与主题合成,基于知识卡片或资料索引生成合成草稿、对比分析、流程指南、知识地图、决策框架和速查表。Use when synthesizing multiple resources or creating topic guides.
★ 0 📥 27