认知放大器 v3.0

> 核心理念：认知不是一次性产品，是持续迭代的贝叶斯更新过程。

> 本质：将"模糊认知"转化为"可验证认知"的循环引擎。

> 核心组件（4个）：

> 1. 目标设定（人类）：设定可量化可验证目标 + 制定验证方式

> 2. 路径寻找（AI）：任务分解 + 证据搜集 + 执行

> 3. 反馈信号（人机协同）：验证信号设计（L1/L2/L3）+ 贝叶斯更新

> 4. 循环迭代（AI）：根据反馈调整，直到任务完成

核心原理（第一性原理）

认知升级的本质

第一性原理推导：

认知升级 = 从"不知道"到"知道"，且"知道"是可验证的
障碍1：不知道"如何到达终点"（路径问题）
障碍2：不知道"是否朝目标近了"（反馈问题）
解决方案：任务分解（把大问题拆成可验证小问题） + 证据搜集（找到可验证数据） + 循环迭代（根据反馈调整）

认知放大器本质（一句话）

> 一个将"模糊认知"转化为"可验证认知"的循环引擎——通过任务分解、证据搜集、贝叶斯反馈，逐步提升对问题的理解，直到达到可验证的置信度阈值。

核心组件（仅4个）

| 组件 | 负责 | 核心能力 | 示例 |

|------|------|---------|------|

人机分工（清晰边界）

人类：设定目标（起点+终点）+ 制定验证方式
  ↓
AI：路径寻找（任务分解 + 证据搜集 + 执行）+ 循环迭代
  ↓
协同：反馈信号（AI执行 → 人类验证 或 AI自己验证）
  ↓
认知升级：通过对齐和路径寻找，实现认知升级
  ↓
无限循环：只要能有效分解 + 找到证据，就可以一直循环下去

核心能力边界

认知放大器做不到真正的"无中生有"（创造完全脱离已有规律的全新知识），但可以做出"创造性发现"（泛化到未见过的场景，突破人类思维定式）。

案例：AlphaFold 解决蛋白质折叠问题——预测了人类从未见过的新蛋白质结构，从人类视角看这是"创造"，但从哲学视角看仍是"发现"（物理规律已存在，只是人类不知道）。

适合的问题：

分析类（"分析 XX 格局"）
对比类（"对比 XX 和 YY"）
决策类（"选择 XX 还是 YY？"）
创造性发现类（基于已有规律，且可验证）

不适合的问题：

简单问答（"XX 是什么？"）
信息查询（"XX 的电话是多少？"）
纯未来预测（"XX 会如何演化？"——无法验证）

贝叶斯思维通俗解释：盲人还原魔方

> 核心隐喻：反馈的价值是指数级的 —— 137亿年 vs 2.5分钟，差异达 3.5 × 10¹⁶ 倍。

案例描述

| 维度 | 无反馈（遍历） | 有反馈（贝叶斯迭代） |

|------|----------------|---------------------|

| 时间 | 137亿年 | 2.5 分钟 |

| 核心差异 | 不知道"近了"还是"远了" | 每次转动后知道反馈 |

与认知放大器的对应关系

| 步骤 | 盲人魔方 | 认知放大器 |

|------|-----------|-----------------|

| 1. 首先要行动 | 盲人开始旋转魔方 | 通过 OSINT 收集相关信息 |

| 2. 需要知道朝目标近了还是远了 | 每转动一次，有人告诉他"近了"或"远了" | 多元思维处理 → 分解为可验证子任务 → 贝叶斯分析 |

| 3. 然后重复 | 根据反馈继续转动 | 根据贝叶斯分析结果，继续循环 |

核心要点：

首先要行动：不能只思考不行动（盲人必须开始转动魔方）
关键是需要反馈：不知道朝目标近了还是远了，就是盲目行动
然后是反复行动：根据反馈调整行动，逐步接近目标

自主 Loop 引擎

┌─────────────────────────────────────────┐
│              认知放大自主 Loop（自动运行）                 │
│                                                          │
│  Step 1 ─→ Step 2 ─→ Step 3 ─→ Step 4                │
│  接收任务    证据搜集    多元分析    分解子任务             │
│     ↑                                          ↓       │
│     └──────── Step 5 ←─────────────────────┘           │
│              验证反馈 + 贝叶斯调整                         │
│              ↓（置信度不足）                              │
│              调整任务 → 回到 Step 2                       │
│              ↓（置信度 > 85% 且稳定）                     │
│              任务完成，输出最终报告                         │
└─────────────────────────────────────────┘

Loop 终止条件（三层约束，满足任一即停止）：

第一层：进展约束（防死循环）

| 条件 | 阈值 | 行动 |

|------|------|------|

| 连续无进展 | 连续 3 轮新洞察数 < 1 | 自动停止，输出当前最佳结论 |

| 置信度停滞 | 连续 5 轮置信度变化 < 5% | 降级处理（降低搜索频率，或请求用户补充信息源） |

| 任务分解失败 | 子任务数 = 0 且无法继续分解 | 无法继续，停止并提示用户缩小问题范围 |

第二层：资源约束（防消耗大户）

| 约束维度 | 阈值 | 说明 |

|---------|------|------|

| 最大轮次 | 5 轮（不可覆盖） | 每轮都是重火力（搜索+多元模型），5 轮足够收敛 |

| Token 总预算 | 100k tokens | 约 $0.5（Claude Sonnet），可控 |

| 每轮 Token 预算 | 20k tokens | 强制每轮精简输出 |

| 并行 Agent 上限 | 5 个 | 避免同时启动几十个 Agent |

| 单任务时间上限 | 30 分钟 | 超时强制输出当前最佳结论 |

第三层：质量约束（确保不是垃圾循环）

| 条件 | 要求 | 说明 |

|------|------|------|

| 每轮新洞察 | ≥ 1 条 | 否则本轮无效，自动重新执行 |

| 关键事实验证 | 至少 2 个独立来源 | 防幻觉，必须是 A/B 级来源 |

| 对抗式验证 | 每 3 轮启动一次 Red Team | 专门寻找当前结论的错误 |

| 置信度评估 | ❌ 不能让 AI 自己评估 | 终止条件 = (独立验证通过) AND (连续 2 轮新洞察数 = 0) AND (用户确认) |

Step 1：接收初始任务

目标：理解用户的初始任务，建立先验信念。

执行步骤：

任务澄清（如信息不足）：核心问题是什么？预期输出是什么？时间/资源限制？
建立先验信念：用户对这个问题当前的理解程度（0-100%）
任务分解预判：这个任务是否可以分解为可验证的子任务？

输出：任务说明书（核心问题 + 预期输出 + 先验置信度 + 初始立场 + 子任务预判）

Step 1.5：输入格式检查

检查清单（Step 1 之后、Step 2 之前执行）：

| 检查项 | 要求 | 不完整时的行动 |

|--------|------|----------------|

| 核心问题是否明确？ | 一句话能说清在探究什么 | 提示用户补充 |

| 预期输出是否明确？ | 报告/决策/行动方案至少其一 | 提示用户选择 |

| 任务是否可验证？ | 能分解为子任务 + 有验证信号 | 提示用户缩小范围 |

| 是否适合认知放大器？ | 不是简单问答/查询类问题 | 提示用户用直接对话 |

Step 2：基于 OSINT 原理的证据搜集

> 核心升级：从「信息搜集」升级为「证据搜集」——主动寻找可验证的数据。

核心转变：

| 维度 | 之前（信息搜集） | 现在（证据搜集） |

|------|-----------------|-----------------|

| 目标 | 收集相关信息 | 找到可验证的证据 |

| 方式 | 被动接收搜索结果 | 主动寻找可验证数据 |

| 判断标准 | 信息是否相关？ | 证据是否可验证？ |

执行步骤：

制定证据搜集计划：每个子任务的验证信号是什么？需要什么类型的证据？
多源采集（至少 3 类正交来源）：表面网 / 深网/数据库 / 社交媒体 / 数据平台
对抗式搜集：强制搜集反方观点，防止信息茧房
可信度评级：A/B/C/D/F，核心结论必须有至少 2 个独立 A/B 级来源交叉验证
证据可验证性检查：每条证据标注「是否可验证」

输出：证据搜集报告（证据链 + 可信度评级 + 可验证性标注 + 立场分布）

Step 3：多元思维模型处理信息

目标：用多个正交思维模型交叉透视，而非单一视角。

执行步骤：

模型选择（根据任务性质）：商业/产品判断、趋势/政策分析、个人决策、信息/言论评判
逐模型分析：每个模型揭示问题的什么维度？各模型之间是否存在矛盾？
综合判断：各模型一致指向 → 高置信度；模型间存在矛盾 → 标注「核心不确定性」

输出：多元分析报告（模型 × 维度 × 置信度 + 矛盾点 + 盲区）

Step 4：显式任务分解框架

> 核心升级：从「隐式理解」升级为「显式框架」——用结构化框架确保每个子任务都是「可验证的」。

显式任务分解框架（3 步法）

第 1 步：任务理解检查清单

| 检查项 | 问题 | 必须？ |

|--------|------|--------|

| 1. 核心问题 | 一句话说清：用户在探究什么？ | ✅ |

| 2. 预期输出 | 用户想要什么？（报告/决策/行动方案） | ✅ |

| 3. 可验证性 | 这个任务能否分解为子任务 + 有验证信号？ | ✅ |

| 4. 适合性 | 这个任务是否适合认知放大器？ | ✅ |

第 2 步：任务分解决策树

初始任务
  ↓
【决策点 1】这个任务是"是什么"/"为什么"/"怎么做"？
  ↓
  ├─ "是什么"（描述性）→ 分解为：定义 + 分类 + 举例
  ├─ "为什么"（解释性）→ 分解为：原因 A + 原因 B + 原因 C
  └─ "怎么做"（规范性）→ 分解为：方案 A + 方案 B + 方案 C
  ↓
【决策点 2】每个子任务是否"可验证"？
  ↓
  ├─ 是 → 保留，进入第 3 步
  └─ 否 → 继续分解，直到"可验证"
  ↓
【决策点 3】验证信号是什么类型？
  ↓
  ├─ L1（二进制）：通过/不通过
  ├─ L2（量化）：数值比较、排序、统计检验
  └─ L3（语义）：需要人工判断（尽量避免）

第 3 步：验证信号设计检查清单

| 检查项 | 问题 | 通过标准 |

|--------|------|---------|

| 1. 验证方式 | 如何验证这个子任务完成了？ | 有明确标准 |

| 2. 验证数据 | 验证需要什么数据？ | 数据可获取 |

| 3. 验证来源 | 数据来源是否可靠？ | 至少 2 个独立 A/B 级来源 |

| 4. 验证客观性 | 验证是否客观（不被"顺着说"污染）？ | 优先 L1/L2，避免 L3 |

| 5. 验证可行性 | 当前能否验证（还是只能未来验证）？ | 优先当前可验证 |

输出：子任务分解方案 + 验证信号设计 + 验证可行性评估

Step 5：验证反馈 + 贝叶斯调整（Loop 核心）

目标：用验证结果更新认知，调整任务/子任务，决定是否继续 Loop。

执行步骤：

收集验证结果：每个子任务的验证结果是什么？哪些通过了？哪些没通过？
贝叶斯更新：先验置信度 + 新证据 → 后验置信度
任务调整（关键！）：如果子任务没通过验证 → 调整任务定义 / 补充信息 / 更换分析方法 → 回到 Step 2
循环裁定：

| 条件 | 裁定 | 行动 |

|------|------|------|

| 后验置信度 > 85% 且连续 3 轮稳定 | 任务完成 | 输出最终报告，结束 Loop |

| 后验置信度显著上升/下降（±15%） | 继续循环 | 调整任务，回到 Step 2 |

| 连续 5 轮置信度变化 < 5% | 信息饱和 | 建议用户补充新信息源或缩小问题范围 |

| 用户主动说"停止" | 用户中止 | 输出当前最佳报告 |

快速模式

触发词："快速分析"、"简单分析"、"不用跑 Loop"

执行方式：

只跑 1 轮（Step 1 → Step 2 → Step 3 → 输出初步结论）
跳过 Step 4（任务分解）和 Step 5（贝叶斯调整）
置信度标注为「初步」（通常 50-70%）

FAQ

Q1：认知放大器 vs 直接对话，有什么区别？

直接对话：适合简单问答、信息查询、闲聊，单次交互，无验证机制。

认知放大器：适合复杂分析、深度研究、决策支持，多轮 Loop，有验证机制，置信度可量化。

Q2：置信度是什么？如何计算？

简化公式：

置信度 = (子任务完成数 / 子任务总数) × 0.6
         + (A/B 级来源占比) × 0.3
         + (对抗验证未发现错误 ? 0.1 : 0)

Q3：最大轮次为什么是 5 轮？

设计依据：

认知科学研究表明：大多数问题在 5 轮迭代内可以收敛
Token 预算约束：5 轮 × 20k = 100k tokens（可控成本）
防止死循环：如果 5 轮还无法收敛，说明问题定义有问题，或信息不足

Q4：如何判断「任务完成」？

自动判断（满足全部条件）：

置信度 > 85%
连续 2 轮新洞察数 = 0（没有新信息加入）
用户确认（可选，但推荐）

Q5：认知放大器适合什么类型的问题？

适合：

分析类（"分析 XX 格局"、"研究 XX 的底层逻辑"）
对比类（"对比 XX 和 YY"）
决策类（"选择 XX 还是 YY？"）

不适合：

简单问答（"XX 是什么？"）
信息查询（"XX 的电话是多少？"）
纯未来预测（"XX 会如何演化？"—— 无法验证）

置信度计算指南

简化公式（推荐）

置信度 = (子任务完成数 / 子任务总数) × 0.6
         + (A/B 级来源占比) × 0.3
         + (对抗验证未发现错误 ? 0.1 : 0)

置信度区间含义

| 区间 | 含义 | 建议行动 |

|------|------|---------|

| 0-30% | 很不确定的猜测 | 需要大量证据搜集 |

| 30-50% | 有初步判断，但证据不足 | 继续 Loop，重点搜集反方证据 |

| 50-70% | 有判断，基本证据支撑 | 可以继续 Loop，或输出初步结论 |

| 70-85% | 判断较可靠，证据较充分 | 建议再跑 1-2 轮，巩固结论 |

| 85-95% | 判断很可靠，证据充分 | 可以停止，输出最终报告 |

来源可信度评级指南

评级标准（详细说明）

| 评级 | 标准 | 示例 |

|------|------|------|

| A | 一手权威来源（官方文件、原始数据、同行评议论文） | 政府公告、公司年报、学术论文（DOI 可查） |

| B | 可靠二手来源（权威媒体、行业报告） | 新华社、人民日报、IDC 报告、Gartner 报告 |

| C | 有一定可信度（知名博客、专业论坛） | 知乎专栏、技术博客（有署名）、行业 KOL 微博 |

| D | 可信度不确定（需交叉验证） | 匿名论坛、个人小程序、无署名文章 |

| F | 不可靠（匿名、无出处、明显偏见） | 营销软文、标题党、明显错误信息 |

交叉验证规则

核心结论必须有至少 2 个独立 A/B 级来源交叉验证。

独立来源定义：

不是「同一篇文章的转载」
不是「同一家媒体的不同记者」
必须是「不同机构、不同作者、不同数据采集方式」

一句话总结

> 认知放大器 v3.0：将"模糊认知"转化为"可验证认知"的循环引擎——人类设定目标 + 制定验证方式，AI 路径寻找 + 循环迭代，直到任务完成。

v3.0 核心升级：

基于第一性原理精简：从 ~1050 行精简到 ~390 行（↓43%），核心组件从 15 个精简到 4 个
Step 2 升级：从「信息搜集」到「证据搜集」——主动寻找可验证的数据
Step 4 升级：从「隐式理解」到「显式框架」——用结构化框架确保子任务可验证

版本：3.0.0

更新日期：2026-06-12

核心升级：基于第一性原理精简重构，去掉所有历史版本号引用，统一版本标识

TRACE 评测综合评级：4.8/5（优秀）

版本历史

共 5 个版本

v3.0.1 v3.0.1 - 修复版本标识混乱问题（TRACE 评测反馈） - 删除所有章节标题中的历史版本号引用（v2.2/v2.3） - 统一 frontmatter / 标题 / 末尾版本总结的版本号 - 微调末尾 TRACE 评测信息（综合评级 4.8/5）当前

2026-06-12 12:31 安全安全
v3.0.0 v3.0 - 基于第一性原理精简重构 - 从 ~1050行精简到 ~600行（↓43%） - 核心组件从15个精简到4个（目标设定、路径寻找、反馈信号、循环迭代） - 新增"第一性原理"核心原理章节 - 简化冗余案例（AlphaFold案例从50行→15行；盲人魔方案例从100行→30行） - 重组结构（基于4个核心组件重新组织）

2026-06-11 20:56 安全安全
v2.2.0 ## v2.2.0 更新内容（2026-06-10） ### 🎯 针对 TRACE 评测反馈改进（综合评级 4.4 → 目标 4.7+） **评测背景**：腾讯 SkillHub 社区 TRACE 评测体系（Trust/Reliability/Adaptability/Convention/Effectiveness）自动评测，综合评级 4.4/5（优秀），但有 5 个维度 < 4.5 分。 **改进目标**：针对性解决评测反馈的短板，提升用户体验。 --- ### ✅ 新增功能（针对 R 维度：可靠性 3.9 → 目标 4.3+） #### 1. 新增 Step 1.5「输入格式检查」（针对功能完善性 4.3） - **问题**：v2.1 输入不完整时会直接执行，而不是提示修正 - **改进**：Step 1 之后、Step 2 之前执行检查清单： - 核心问题是否明确？ - 预期输出是否明确？ - 任务是否可验证？ - 是否适合认知放大器？ - **不完整时的行动**：输出 `⚠️ 输入信息不完整，无法启动高质量 Loop`，提示用户补充 - **用户强制继续**：如果说"先按现有信息跑一轮"，则基于最佳推测启动，但标注「输入不完整，结论置信度降低 10-20%」 #### 2. 新增「错误处理」章节（针对异常处理 3.5） - **问题**：v2.1 如果中途出问题，不会清楚地告诉用户出了什么问题、怎么解决 - **改进**：8 类错误分类（E1-E8），每类必须输出： - 错误描述（具体说明出了什么问题，不能只说"出错了"） - 可能原因（列举 2-3 个最常见原因） - 建议行动（给出 3 个用户可操作的步骤） - **错误分类**：搜索无结果、所有来源都不可靠、子任务无法分解、Loop 卡住、置信度一直上不去、资源即将耗尽、Red Team 找到致命错误、平台不支持 Automation #### 3. 新增「特殊情况处理」章节（针对内容完整度 4.5） - **问题**：v2.1 有些细节没讲清楚，比如遇到特殊情况怎么处理 - **改进**：5 类特殊情况的处理方案： - 搜索无结果怎么办？（换关键词、扩大范围、暂时跳过） - 所有来源都不可靠怎么办？（手动提供权威来源、换角度搜索、接受"无法验证"） - 子任务无法分解怎么办？（缩小范围、改成"搜集信息"任务、手动提供验证标准） - Loop 卡住（连续无进展）怎么办？（手动补充新信息源、缩小问题范围、主动说"停止"） - 置信度一直上不去怎么办？（接受当前置信度 + 明确标注"哪些部分证据不足"、换角度重新分析、说"输出当前报告"） --- ### 🔧 改进优化（针对 E 维度：有效性 4.4 → 目标 4.7+） #### 4. 补充说明"85% 置信度阈值来源"（针对输出准确性 4.5） - **问题**：评测员反馈"置信度阈值是怎么来的没说清楚" - **改进**：在「质量控制」章节详细补充： - **来源**：波普尔证伪主义 + 科学哲学"可错论" - **逻辑链**：真理不是找到对的，而是排除所有错的 → AI 的"我对"不可信（顺着说偏差） → 可靠的方式：找到所有能找到的错误 → 还没找到 → 暂时接受 - **85% 是经验阈值**： - 50-70%：有些证据，但关键链路缺失 - 70-85%：关键链路有证据，但存在反例或替代解释 - 85%+：关键链路有多个独立来源验证，且 Red Team 找不到致命错误 - **为什么不是 95% 或 99%？**： - 认知任务（尤其是涉及人类行为、未来预测）几乎不可能达到 95%+ 置信度 - 强行追求 95% 会导致 Loop 无限运行（永远在找"那最后一个错误"） - 85% 是"足够行动"的阈值（你可以基于 85% 置信度的结论做决策，同时知道哪里可能出错） #### 5. README.md 新增「自动循环说明」章节（针对开箱即用度 4.0） - **问题**：评测员反馈"自动循环功能要是平台不支持就白搭，没有备用方案" - **改进**：详细说明两种模式： - **平台支持自动循环时（推荐）**：Loop 会自动定时运行，无需手动触发每一轮 - **平台不支持自动循环时（备用方案）**：使用"手动循环"模式，每轮结束后用户输入"继续"或复制 `## 下一轮计划` 的内容 - **如何判断当前平台是否支持自动循环？**：提供决策表（现象 → 说明 → 应对） --- ### 📚 新增文档（针对 C 维度：规范性 4.5 → 目标 4.8+） #### 6. 新增 `FAQ.md`（针对反模式与 FAQ 4.0） - **问题**：v2.1 缺少"容易犯哪些错"和"常见问题解答"板块，新手可能不知道哪些用法是错误的 - **改进**：新增 `FAQ.md`，包含： - **反模式（5 个常见错误用法）**： - 用认知放大器查天气、查简单定义（应该用直接对话） - 输入任务太模糊（"帮我分析一下" → 无法分解子任务） - 期望 AI 100% 正确（认知任务几乎不可能达到 95%+ 置信度） - 不提供反馈（Loop 无法根据你的反馈调整方向） - 忽略 `## 资源消耗` 小节（可能导致任务被截断） - **常见问题解答（10 个 FAQ）**： - 认知放大器和直接对话有什么区别？ - 为什么需要"可验证性"？ - 置信度 85% 是什么意思？是不是很高了？ - Loop 会无限运行吗？（有三层约束防死循环） - 如果我对结果不满意怎么办？（说"继续"或"调整方向"） - 这个 Skill 会消耗很多 Token 吗？（有资源约束，最大 100k tokens） - 为什么有时候 Loop 突然停止了？（触发了进展约束或资源约束） - 我可以中途修改任务吗？（可以，输入"调整任务：XXX"） - 认知放大器适合什么样的问题？（深度研究类，不适合简单问答） - 为什么有时候会启动 Red Team？（每 3 轮自动启动，对抗式验证） - **置信度阈值来源说明**（详细解释 85% 是怎么来的） --- ### 🐛 修复问题（v2.1 → v2.2） - 修复 v2.1 的"输入格式检查缺失"问题（功能完善性 4.3） - 修复 v2.1 的"错误处理不清晰"问题（异常处理 3.5） - 修复 v2.1 的"特殊情况处理缺失"问题（内容完整度 4.5） - 修复 v2.1 的"置信度阈值来源未说明"问题（输出准确性 4.5） - 修复 v2.1 的"自动循环无备用方案"问题（开箱即用度 4.0） - 修复 v2.1 的"FAQ 缺失"问题（反模式与 FAQ 4.0） --- ### 📊 预期效果 | 评测维度 | v2.1 评分 | v2.2 改进 | 预期评分 | |---------|-------------|---------|---------| | T 可信任度 | 4.8/5 | 保持 | 4.8+ | | R 可靠性 | **3.9/5** | 输入验证 + 错误处理 + 特殊情况处理 | **4.3+** | | A 适用性 | 4.7/5 | 保持 | 4.7+ | | C 规范性 | 4.5/5 | 新增 FAQ.md | **4.8+** | | E 有效性 | 4.4/5 | 置信度说明 + 备用方案 | **4.7+** | | **综合评级** | **4.4/5（优秀）** | 针对性改进 | **4.7+（接近满分）** | --- ### 🚀 后续计划 - 重新上传到腾讯 SkillHub 社区，触发重新评测 - 实战测试 v2.2（用真实问题跑几轮，验证改进效果） - 收集用户反馈，持续迭代 --- ## v2.1.0 更新内容（2026-06-10） ### ✅ 新增功能 1. **三层约束机制**（防死循环、防消耗大户、防垃圾循环） - 第一层：进展约束（连续 3 轮无新洞察 → 自动停止） - 第二层：资源约束（最大 5 轮、100k tokens、5 个并行 Agent） - 第三层：质量约束（每轮新洞察 ≥ 1、2 个独立来源、Red Team） 2. **资源管理模块** - Token 预算管理（总预算 + 每轮预算） - 并行 Agent 上限（防止同时启动几十个 Agent） - 时间约束（单轮 + 总时间） - 消耗大户防护（危险信号自动触发资源保护） 3. **质量控制模块** - 置信度不能让 AI 自己评估（核心原则） - 终止条件 = 独立验证 + 无新洞察 + 用户确认 - 对抗式验证（Red Team）是置信度的唯一可靠来源 ### 🔄 改进优化 - 终止条件重构：不再依赖 AI 自评估置信度，改用三层约束 + 用户确认 - 资源消耗可视化：每轮结束后输出 `## 资源消耗` 小节 - Loop 自动化机制：支持三种方案（Automation 定时循环 / 多 Agent 并行 / 混合模式） ### 🐛 修复问题 - 修复 v2.0 的"死循环风险"（无进展约束） - 修复 v2.0 的"消耗大户风险"（无资源约束） - 修复 v2.0 的"垃圾循环风险"（无质量约束） - 修复 v2.0 的"置信度自评估偏差"（AI 会自信地宣布自己置信度 90%） --- ## v2.0.0 更新内容（2026-06-10） ### ✅ 新增功能 1. **自主 Loop 引擎**：从「五阶段手动流程」升级为「自主 Loop 引擎」 2. **自动分解为可验证子任务**（v2.0 核心升级） 3. **验证信号设计**：每个子任务必须有验证信号（L1/L2/L3） 4. **贝叶斯自动调整**：根据验证结果自动调整任务 5. **多 Agent 并行处理**：支持子任务并行（类似 Boris 的并行 Agent）

2026-06-10 19:07 安全安全
v2.1.0 ## v2.1.0 更新内容（2026-06-10） ### ✅ 新增功能 1. **三层约束机制**（防死循环、防消耗大户、防垃圾循环） - 第一层：进展约束（连续 3 轮无新洞察 → 自动停止） - 第二层：资源约束（最大 5 轮、100k tokens、5 个并行 Agent） - 第三层：质量约束（每轮新洞察 ≥ 1、2 个独立来源、Red Team） 2. **资源管理模块** - Token 预算管理（总预算 + 每轮预算） - 并行 Agent 上限（防止同时启动几十个 Agent） - 时间约束（单轮 + 总时间） - 消耗大户防护（危险信号自动触发资源保护） 3. **质量控制模块** - 置信度不能让 AI 自己评估（核心原则） - 终止条件 = 独立验证 + 无新洞察 + 用户确认 - 对抗式验证（Red Team）是置信度的唯一可靠来源 ### 🔄 改进优化 - 终止条件重构：不再依赖 AI 自评估置信度，改用三层约束 + 用户确认 - 资源消耗可视化：每轮结束后输出 `## 资源消耗` 小节 - Loop 自动化机制：支持三种方案（Automation 定时循环 / 多 Agent 并行 / 混合模式） ### 🐛 修复问题 - 修复 v2.0 的"死循环风险"（无进展约束） - 修复 v2.0 的"消耗大户风险"（无资源约束） - 修复 v2.0 的"垃圾循环风险"（无质量约束） - 修复 v2.0 的"置信度自评估偏差"（AI 会自信地宣布自己置信度 90%） ## v2.0.0 更新内容（2026-06-10） ### ✅ 新增功能 1. **自主 Loop 引擎**：从「五阶段手动流程」升级为「自主 Loop 引擎」 2. **自动分解为可验证子任务**（v2.0 核心升级） 3. **验证信号设计**：每个子任务必须有验证信号（L1/L2/L3） 4. **贝叶斯自动调整**：根据验证结果自动调整任务 5. **多 Agent 并行处理**：支持子任务并行（类似 Boris 的并行 Agent） ## v1.0.0 初始版本（2026-06-09） - 五阶段手动流程：信息搜集 → 多元思维模型处理 → 深度分析 → 模式识别 → 行动建议

2026-06-10 17:03 安全安全
v1.0.0 Initial release

2026-06-05 16:34 安全安全

认知放大器

概述

认知放大器 v3.0

核心原理（第一性原理）

认知升级的本质

认知放大器本质（一句话）

核心组件（仅4个）

人机分工（清晰边界）

核心能力边界

贝叶斯思维通俗解释：盲人还原魔方

案例描述

与认知放大器的对应关系

自主 Loop 引擎

第一层：进展约束（防死循环）

第二层：资源约束（防消耗大户）

第三层：质量约束（确保不是垃圾循环）

Step 1：接收初始任务

Step 1.5：输入格式检查

Step 2：基于 OSINT 原理的证据搜集

Step 3：多元思维模型处理信息

Step 4：显式任务分解框架

第 1 步：任务理解检查清单

第 2 步：任务分解决策树

第 3 步：验证信号设计检查清单

Step 5：验证反馈 + 贝叶斯调整（Loop 核心）

快速模式

FAQ

Q1：认知放大器 vs 直接对话，有什么区别？

Q2：置信度是什么？如何计算？

Q3：最大轮次为什么是 5 轮？

Q4：如何判断「任务完成」？

Q5：认知放大器适合什么类型的问题？

置信度计算指南

简化公式（推荐）

置信度区间含义

来源可信度评级指南

评级标准（详细说明）

交叉验证规则

一句话总结

版本历史

安全检测

腾讯云安全 (Keen)

腾讯云安全 (Sanbu)

🔗 相关推荐

Skill 创建与迭代工具，从零创建 Skill、修改现有 Skill、运行评估测试性能。

一个会自进化的日志分析工具

build-your-own-agent