← 返回
未分类

LLM_Wiki_Advanced

Self-contained LLM knowledge base with EBR (Evidence-Based Reasoning) engine and local vector semantic search (Xenova/all-MiniLM-L6-v2, fully offline). Ingest documents into structured knowledge cards, retrieve with hybrid search (local vector + BM25 keyword fallback), reason with evidence-weighted paths (Definitive / Causal / Predictive / Evaluative), user-confirmed write-back. All knowledge is source-anchored; hallucination is structurally blocked.
Self-contained LLM knowledge base with EBR (Evidence-Based Reasoning) engine and local vector semantic search (Xenova/all-MiniLM-L6-v2, fully offline). Ingest documents into structured knowledge cards, retrieve with hybrid search (local vector + BM25 keyword fallback), reason with evidence-weighted paths (Definitive / Causal / Predictive / Evaluative), user-confirmed write-back. All knowledge is source-anchored; hallucination is structurally blocked.
Hugo_Chan
未分类 community v1.0.0 1 版本 99367.1 Key: 无需
★ 1
Stars
📥 137
下载
💾 0
安装
1
版本
#latest

概述

环境自适应

wiki+ 同时支持 本地模式(Cursor / IDE,有 bash + Node.js)和 云端模式(无 bash / Node.js)。

环境判断规则:在执行任何 bash 命令前,先判断当前环境是否具备 shell 执行能力:

能力本地模式(有 bash + Node.js)云端模式(无 bash)
-------------------------------------------------------------------------------------------
向量检索bash .cursor/skills/wiki+/tools/search.sh "查询词"直接读取 wiki/cards/*.md(关键词匹配)
索引更新node .cursor/skills/wiki+/tools/vec-index.mjs --update提示用户在本地运行 install 脚本
安装脚本可运行,完整初始化(含模型下载和索引构建)引导用户在本地 Cursor 环境中运行以获得完整向量检索能力

> 切换到云端模式时,在回答末尾注明"⚠️ 当前以降级模式运行(无向量索引),检索基于关键词匹配"。

环境初始化

  • 首次使用时,自动检测 wiki/ 目录和向量索引(wiki/.wiki-vec/config.json)是否存在。
  • 本地模式:若未初始化,提示用户根据系统运行以下命令:
  • Windows(PowerShell):cd .cursor\skills\wiki+\tools; npm install; node vec-index.mjs
  • macOS/Linux:bash .cursor/skills/wiki+/install.sh
  • 云端模式:若无法执行 bash,当前会话使用关键词匹配作为临时检索,同时主动提示用户

> "当前处于云端模式,本地向量检索不可用。请在本地 Cursor 环境中运行安装脚本完成初始化,下次检索精度将大幅提升。"

摄入文档 (@wiki+ ingest)

输入:用户指定的文档路径(支持 PDF、Word、Excel、图片、Markdown 等)。

流程

  1. 解析文档全部内容,生成 50-100 字的 L1 摘要,只提取事实。
  2. 将摘要添加到 wiki/index.md 相应分类下。
  3. 若涉及已有概念,更新对应卡片,新增
  4. 若引入新概念,创建 wiki/cards/新概念.md,至少包含定义和来源引用。
  5. 完成后执行增量向量索引更新本地模式执行):

```bash

node .cursor/skills/wiki+/tools/vec-index.mjs --update

```

云端模式:无法执行,提示用户:"建议在本地运行安装脚本启用向量检索,以便下次检索时获得更精准的语义匹配。"

知识卡片模板 (wiki/cards/概念名.md):

# 概念名

- **定义**:(一句话定义)
- **关键论证**:(关键事实或数据)
- **关联概念**:[[关联1]], [[关联2]]
- **来源**:`路径/文件名` (章节或页码)

检索查询 (@wiki+ search)

  1. 首先读取 wiki/index.md 及相关聚合页面,快速判断主题是否覆盖。
  2. 本地模式:调用本地向量语义搜索(Xenova/all-MiniLM-L6-v2,完全离线);云端模式:临时降级为直接读取 wiki/cards/*.md 进行关键词匹配,并在回答末尾提示用户在本地完成安装:

```bash

bash .cursor/skills/wiki+/tools/search.sh "查询词"

```

  1. 从返回结果中挑选相关性最强的不超过 10 个片段,读取对应完整卡片,进入推演引擎。
  2. 降级触发条件:向量索引未建立 / bash 不可用 / Node.js 未安装 / 返回结果相关性极低,均自动回退到直接文件读取。
  3. 若搜索结果完全不相关,必须回答"知识库未收录相关内容",严禁编造。

循证推演引擎(EBR,Evidence-Based Reasoning Engine)

> 所有检索命中的回答都必须经过此引擎处理,不得直接返回原始检索片段。

第一步:问题分类(路由 A)

在回答前,先判断问题属于哪种类型,并明确说明将采用哪条推演路径:

问题类型识别关键词推演路径
--------------------------------------
定义型是什么 定义 概念直接检索 → 结构化呈现
因果型为什么 如何导致 机制因果链 → 追溯一阶/二阶效应
预测型会怎样 如果会 影响前提设定 → 逐步推演 → 不确定性标注
评估型好不好 优劣 应该MECE 拆分 → 多维度证据 → 权衡结论
知识缺口型检索无命中声明缺口 → 类比推理 → 建议来源

第二步:分路径推演

定义型路径

  1. 从知识卡片提取核心定义;
  2. 补充关联概念与来源出处;
  3. 若存在多个定义,列出差异。

因果型路径

  1. 确定触发因素;
  2. 逐层列出一阶机制 → 一阶效应;
  3. 识别二阶反馈(放大/对冲/约束);
  4. 指出在什么条件下因果链失效。

预测型路径

  1. 明确列出推演的前提假设;
  2. 从知识库已知规律出发,逐步外推;
  3. 每一步标注证据权重(见第三步);
  4. 给出结论区间,而非单一确定答案。

评估型路径

  1. 用 MECE 原则将问题拆成互斥的评估维度;
  2. 每个维度分别检索证据;
  3. 对各维度赋权并综合;
  4. 结论明确说明权衡取舍。

知识缺口路径

  1. 明确声明:"知识库未收录此内容";
  2. 若可以,用已有近似知识做类比推理,并标记为 🔴;
  3. 建议用户通过 @wiki+ ingest 补充相关文档。

第三步:证据权重标注(证据 C)

推演过程中,每一个关键命题都必须附带以下标记之一:

  • 🟢 确定:知识库中有直接支持,附卡片引用 ([[卡片名]])
  • 🟡 推演:基于知识库内容的逻辑推导,推导过程可见
  • 🔴 假设:类比推理或外部知识,结论待验证,需用户确认

规则:

  • 不得出现无标记的实质性命题;
  • 🔴 标记的内容必须在回答末尾汇总,提示用户注意;
  • 若整个回答全为 🟢,可省略标记,但须在末尾注明"以上均来自知识库"。

第四步:结构化输出(金字塔原则)

所有路径的最终输出统一格式:

【结论】(一句话直接回答,不超过 50 字)

【支撑】
  • 论点 1 🟢/🟡/🔴
    - 依据 …
  • 论点 2 🟢/🟡/🔴
    - 依据 …

【知识缺口】(若有 🔴 命题,在此汇总,建议补充哪些文档)

【引用】([[卡片1]], [[卡片2]], …)

反馈记录 (@wiki+ remember)

回答用户问题后,若发现可能值得保存的新知识,必须主动询问用户。

触发条件

  • 用户提供了补充事实或纠正信息
  • 基于当前 Wiki 内容推导出新关联(推导过程透明可溯)
  • 用户明确表达确认

流程

  1. 生成简明的"建议记录内容"。
  2. 询问用户:"是否将 '...' 记录到 wiki/cards/xxx.md?(是/否/修改)"
  3. 仅当用户明确确认后才写入,写入时添加
  4. 写入完成后,本地模式自动执行增量向量索引更新;云端模式无法执行,提示用户在本地运行安装脚本同步索引:

```bash

node .cursor/skills/wiki+/tools/vec-index.mjs --update

```

  1. 若无值得保存的内容,不发起询问。

写入约束

  • 必须包含来源标注;若用户引用外部资料,需提供文档名或链接,否则拒绝记录。
  • 写入前执行去重检查,避免重复记录。

维护与诊断

  • @wiki+ rebuild-index:执行 node .cursor/skills/wiki+/tools/vec-index.mjs 全量重建向量索引。
  • @wiki+ check-health:LLM 扫描全部页面,检查孤立链接、矛盾陈述、引用缺失,生成 wiki/issues.md 待办。
  • @wiki+ ask-question:手动调用反馈层询问流程,分析当前对话是否有值得记录的知识。

增量向量索引更新

所有摄入或反馈写入后,执行:

node .cursor/skills/wiki+/tools/vec-index.mjs --update

--update 模式只扫描新增或修改的文件,不重建已有索引,保证快速完成。

存储层级说明

层级描述存储位置
------------------------------------------
L0 原始素材用户传入的原文wiki/inbox/
L1 瞬悟摘要50-100 字核心摘要wiki/index.md 条目
L2 观点重构300-500 字自然语言重述独立 .md 段落,含来源注释
L3 核心知识卡概念的终极浓缩wiki/cards/*.md
Lx 聚合索引全局与领域聚合页wiki/index.md 及领域页面

其他资源

  • 使用说明:查阅 wiki-guide.md
  • Windows 安装:PowerShell 执行 cd .cursor\skills\wiki+\tools; npm install; node vec-index.mjs
  • macOS/Linux 安装:install.sh
  • 向量索引构建:tools/vec-index.mjs
  • 向量语义搜索:tools/vec-search.mjs
  • 统一搜索入口:tools/search.sh

版本历史

共 1 个版本

  • v1.0.0 这是一个知识库skill,拥有向量化检索能力、增量闭环管理能力以及信息推演能力,比较全面。该Skill借鉴了市场的LLM Wiki结构、DeepSeek V4的CSA注意力机制以及钱老的方法论,向他们致谢。 当前
    2026-04-30 15:09 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

ai-intelligence

self-improving agent

pskoett
捕获经验教训、错误和纠正,以实现持续改进。使用时机:(1)命令或操作意外失败;(2)用户纠正……
★ 4,062 📥 799,980
ai-intelligence

Self-Improving + Proactive Agent

ivangdavila
自我反思+自我批评+自我学习+自组织记忆。智能体评估自身工作、发现错误并持续改进。
★ 1,363 📥 319,049
developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 672 📥 324,528