← 返回
未分类

kb-synthesizer

跨资料聚类与主题合成,基于知识卡片或资料索引生成合成草稿、对比分析、流程指南、知识地图、决策框架和速查表。Use when synthesizing multiple resources or creating topic guides.
跨资料聚类与主题合成,基于知识卡片或资料索引生成合成草稿、对比分析、流程指南、知识地图、决策框架和速查表。Use when synthesizing multiple resources or creating topic guides.
sullior
未分类 community v1.0.1 2 版本 100000 Key: 无需
★ 0
Stars
📥 22
下载
💾 0
安装
2
版本
#latest

概述

跨资料智能合成 Skill

概述

将多条已消化的知识卡片(来自 kb-auto-digester)或原始 A 类资料,按主题/标签/工具自动聚类,智能判断合成形态,逐层合并为可执行的结构化指南。

核心价值:从离散的「收藏」到收敛的「决策」——把多篇资料中的共识、分歧、操作步骤整合成一份能直接使用的结果。

设计原则:输入不绑定字段名,聚类不依赖特定分级,输出结构通用化——可适配 IMA、Obsidian、Notion 等任意知识管理系统。


输入要求

任意 JSON 数组,每条至少包含:

字段必填说明
------:--:------
title资料标题
theme推荐主题分类(用于聚类)
grade推荐A/B/C 等级
tags可选标签列表
summary可选摘要/一句话价值
media_id可选用于在支持的平台中定位原文

内置适配器:默认读取 processed_kb_items_latest.json(kb-inventory-update 输出),自动提取 value 字段作为摘要。


工作流程

Phase 1: 聚类 → Phase 2: 形态匹配 → Phase 3: 逐层合成 → Phase 4: 输出

Phase 1:聚类引擎

python3 skills/kb-synthesizer/scripts/cluster.py \
    --input processed_kb_items_latest.json \
    --output synthesis_clusters.json \
    [--min-items 2] \
    [--focus "Codex"] \
    [--depth L2]

聚类规则(按优先级):

规则触发条件权重
---------------:--:
同主题分组theme 相同基础
同工具分组标题共享工具关键词(Codex/Seedance/GPT-Image 等)+2
标签共现相同二级标签+1
用户指定--focus "关键词"过滤

输出 synthesis_clusters.json,每个 cluster 包含:主题名、成员列表、摘要集合、推荐合成形态、推荐深度。

Phase 2:形态匹配器

聚类引擎内置形态匹配,根据 cluster 特征自动决策:

if 同一工具名出现在 ≥2 条 
   AND 各自说的是不同方法:
    → "对比分析"
    → 输出: 工具X的N种用法对比

elif 资料中包含步骤关键词 (步骤/流程/如何做/教程/保姆级):
    → "流程指南"
    → 输出: 统一操作SOP

elif 同一主题 ≥3 条,各覆盖不同侧面:
    → "知识地图"
    → 输出: 主题X全景图

elif 资料中包含选择/取舍关键词 (选哪个/vs/对比/推荐):
    → "决策框架"
    → 输出: 如何选择X

else:
    → "速查表"
    → 输出: 关键信息速查

Phase 3:逐层合成(AI 驱动)

根据推荐的合成形态和深度,AI 按以下逻辑处理:

L1(摘要合并,默认)

  1. 读取 cluster 中每条资料的摘要(知识卡片优先,其次 value 字段)
  2. 提取公共主题 + 去重
  3. 按形态模板组织输出
  4. 标记来源追溯

L2(交叉验证,--depth L2

L1 的全部内容 +:

  1. 对每条资料读取或检索关键段落(标题搜索 + 摘要相关段落)
  2. 横向对比:标记分歧点(不同来源说不同的话)
  3. 标记知识缺口(这些资料都没说清楚的地方)
  4. 标注时效性(是否基于过时工具/版本)

L3(全本重构,--depth L3

L2 全部内容 +:

  1. 读取每条资料的完整原文
  2. 全文交叉对比
  3. 引用原文关键段落
  4. 需要 --top 限制(超过 5 条时强制降为 L2)

Phase 4:输出

python3 skills/kb-synthesizer/scripts/synthesize.py \
    --clusters synthesis_clusters.json \
    --output-dir synthesis_outputs/ \
    --generate-files

生成 Markdown 文件,每 cluster 一份。状态更新可通过索引表字段或相关脚本维护,不依赖特定平台工具。


通用输出结构

# 合成指南:{主题名}

**合成类型**:{对比分析/流程指南/知识地图/决策框架/速查表}
**深度**:L1/L2/L3
**来源材料**:{n}条 | 覆盖 {m}个知识库
**更新时间**:{YYYY-MM-DD}

## 一、核心共识
{n条来源一致的共同观点,每条标注来源编号}

## 二、分歧与互补
| 角度 | 来源A | 来源B | 综合判断 |
|------|------|------|---------|

## 三、可执行方案
{按形态展开 - 见下方各形态章节}

## 四、注意事项(跨来源共性风险)

## 五、知识缺口(未被覆盖的内容)

## 附录:来源清单
| # | 标题 | 知识库 | 关键贡献 |
|---|------|--------|---------|

输出形态详情

对比分析

「三」结构:工具/方法对比表(维度 × 来源 × 推荐场景)+ 选择建议

流程指南

「三」结构:统一操作步骤(Step 1→N),合并去重,标注每个步骤来自哪些来源

知识地图

「三」结构:子话题树 Topic → Sub-topic → 核心要点 → 参考来源编号

决策框架

「三」结构:决策树(条件A? → Y:方案1 / N: ...

速查表

「三」结构:提取型表格 名称 | 参数 | 适用场景 | 来源编号


触发方式

触发用户说执行
-------------------
自动检测「合成资料」「看看有什么可合成的」扫描所有 cluster,列出推荐
按主题「合成 Codex 相关的」--focus "Codex"
按标签「合成 Seedance 教程」--focus "Seedance" --tag 教程

与现有技能关系

kb-inventory-update → kb-auto-digester → kb-synthesizer → synthesis_outputs/
     扫描+分级            逐条消化            跨资料合成         结构化指南

不替代任何现有技能,吃前两者的产出做更高层合成。


资源目录

scripts/

  • cluster.py — 聚类引擎 + 形态匹配器
  • synthesize.py — 合成引擎(读取 cluster → 按模板输出)

templates/

  • synthesis_output.md — 通用输出结构模板

版本历史

共 2 个版本

  • v1.0.1 Initial release 当前
    2026-06-03 14:56 安全 安全
  • v1.0.0 Initial release
    2026-06-02 21:24 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

kb-auto-digester

user_99b045d5
批量消化 A 类知识库资料,生成知识卡片并更新产出状态。Use when digesting A-grade items, generating knowledge cards, processing high-value saved re
★ 0 📥 27

ima-kb-connector

user_99b045d5
连接并扫描 IMA 知识库,导出标准化资料清单。Use when the user needs to scan IMA knowledge bases, export IMA resources, or prepare scan_resul
★ 0 📥 25

private-knowledge-base-organizer

user_99b045d5
整理收藏资料、网址、笔记、视频、PDF、文档并转化为私有知识库索引、知识卡片、成果卡片和复盘机制。Use when organizing saved resources, building a personal knowledge base
★ 0 📥 41