> 核心理念:认知不是一次性产品,是持续迭代的贝叶斯更新过程。
> 本质:将"模糊认知"转化为"可验证认知"的循环引擎。
> 核心组件(4个):
> 1. 目标设定(人类):设定可量化可验证目标 + 制定验证方式
> 2. 路径寻找(AI):任务分解 + 证据搜集 + 执行
> 3. 反馈信号(人机协同):验证信号设计(L1/L2/L3)+ 贝叶斯更新
> 4. 循环迭代(AI):根据反馈调整,直到任务完成
第一性原理推导:
> 一个将"模糊认知"转化为"可验证认知"的循环引擎——通过任务分解、证据搜集、贝叶斯反馈,逐步提升对问题的理解,直到达到可验证的置信度阈值。
| 组件 | 负责 | 核心能力 | 示例 |
|------|------|---------|------|
| 1. 目标设定(人类) | 设定可量化可验证目标 + 制定验证方式 | 问题定义 + 验证设计 | "分析 AI coding 格局,输出 Top 10 清单(按 GitHub stars)" |
| 2. 路径寻找(AI) | 任务分解 + 证据搜集 + 执行 | 将大问题拆成可验证小问题 + 找到可验证数据 | 分解为子任务 → OSINT 搜集数据 → 生成 Top 10 清单 |
| 3. 反馈信号(人机协同) | 验证信号设计(L1/L2/L3)+ 贝叶斯更新 | 判断"近了"还是"远了" | L1(二进制):通过/不通过;L2(量化):数值比较 |
| 4. 循环迭代(AI) | 根据反馈调整,直到任务完成 | 行动 → 反馈 → 行动 → 反馈... | 根据贝叶斯分析结果,继续循环 |
人类:设定目标(起点+终点)+ 制定验证方式
↓
AI:路径寻找(任务分解 + 证据搜集 + 执行)+ 循环迭代
↓
协同:反馈信号(AI执行 → 人类验证 或 AI自己验证)
↓
认知升级:通过对齐和路径寻找,实现认知升级
↓
无限循环:只要能有效分解 + 找到证据,就可以一直循环下去
认知放大器做不到真正的"无中生有"(创造完全脱离已有规律的全新知识),但可以做出"创造性发现"(泛化到未见过的场景,突破人类思维定式)。
案例:AlphaFold 解决蛋白质折叠问题——预测了人类从未见过的新蛋白质结构,从人类视角看这是"创造",但从哲学视角看仍是"发现"(物理规律已存在,只是人类不知道)。
适合的问题:
不适合的问题:
> 核心隐喻:反馈的价值是指数级的 —— 137亿年 vs 2.5分钟,差异达 3.5 × 10¹⁶ 倍。
| 维度 | 无反馈(遍历) | 有反馈(贝叶斯迭代) |
|------|----------------|---------------------|
| 时间 | 137亿年 | 2.5 分钟 |
| 核心差异 | 不知道"近了"还是"远了" | 每次转动后知道反馈 |
| 步骤 | 盲人魔方 | 认知放大器 |
|------|-----------|-----------------|
| 1. 首先要行动 | 盲人开始旋转魔方 | 通过 OSINT 收集相关信息 |
| 2. 需要知道朝目标近了还是远了 | 每转动一次,有人告诉他"近了"或"远了" | 多元思维处理 → 分解为可验证子任务 → 贝叶斯分析 |
| 3. 然后重复 | 根据反馈继续转动 | 根据贝叶斯分析结果,继续循环 |
核心要点:
┌─────────────────────────────────────────┐
│ 认知放大自主 Loop(自动运行) │
│ │
│ Step 1 ─→ Step 2 ─→ Step 3 ─→ Step 4 │
│ 接收任务 证据搜集 多元分析 分解子任务 │
│ ↑ ↓ │
│ └──────── Step 5 ←─────────────────────┘ │
│ 验证反馈 + 贝叶斯调整 │
│ ↓(置信度不足) │
│ 调整任务 → 回到 Step 2 │
│ ↓(置信度 > 85% 且稳定) │
│ 任务完成,输出最终报告 │
└─────────────────────────────────────────┘
Loop 终止条件(三层约束,满足任一即停止):
| 条件 | 阈值 | 行动 |
|------|------|------|
| 连续无进展 | 连续 3 轮新洞察数 < 1 | 自动停止,输出当前最佳结论 |
| 置信度停滞 | 连续 5 轮置信度变化 < 5% | 降级处理(降低搜索频率,或请求用户补充信息源) |
| 任务分解失败 | 子任务数 = 0 且无法继续分解 | 无法继续,停止并提示用户缩小问题范围 |
| 约束维度 | 阈值 | 说明 |
|---------|------|------|
| 最大轮次 | 5 轮(不可覆盖) | 每轮都是重火力(搜索+多元模型),5 轮足够收敛 |
| Token 总预算 | 100k tokens | 约 $0.5(Claude Sonnet),可控 |
| 每轮 Token 预算 | 20k tokens | 强制每轮精简输出 |
| 并行 Agent 上限 | 5 个 | 避免同时启动几十个 Agent |
| 单任务时间上限 | 30 分钟 | 超时强制输出当前最佳结论 |
| 条件 | 要求 | 说明 |
|------|------|------|
| 每轮新洞察 | ≥ 1 条 | 否则本轮无效,自动重新执行 |
| 关键事实验证 | 至少 2 个独立来源 | 防幻觉,必须是 A/B 级来源 |
| 对抗式验证 | 每 3 轮启动一次 Red Team | 专门寻找当前结论的错误 |
| 置信度评估 | ❌ 不能让 AI 自己评估 | 终止条件 = (独立验证通过) AND (连续 2 轮新洞察数 = 0) AND (用户确认) |
目标:理解用户的初始任务,建立先验信念。
执行步骤:
输出:任务说明书(核心问题 + 预期输出 + 先验置信度 + 初始立场 + 子任务预判)
检查清单(Step 1 之后、Step 2 之前执行):
| 检查项 | 要求 | 不完整时的行动 |
|--------|------|----------------|
| 核心问题是否明确? | 一句话能说清在探究什么 | 提示用户补充 |
| 预期输出是否明确? | 报告/决策/行动方案至少其一 | 提示用户选择 |
| 任务是否可验证? | 能分解为子任务 + 有验证信号 | 提示用户缩小范围 |
| 是否适合认知放大器? | 不是简单问答/查询类问题 | 提示用户用直接对话 |
> 核心升级:从「信息搜集」升级为「证据搜集」——主动寻找可验证的数据。
核心转变:
| 维度 | 之前(信息搜集) | 现在(证据搜集) |
|------|-----------------|-----------------|
| 目标 | 收集相关信息 | 找到可验证的证据 |
| 方式 | 被动接收搜索结果 | 主动寻找可验证数据 |
| 判断标准 | 信息是否相关? | 证据是否可验证? |
执行步骤:
输出:证据搜集报告(证据链 + 可信度评级 + 可验证性标注 + 立场分布)
目标:用多个正交思维模型交叉透视,而非单一视角。
执行步骤:
输出:多元分析报告(模型 × 维度 × 置信度 + 矛盾点 + 盲区)
> 核心升级:从「隐式理解」升级为「显式框架」——用结构化框架确保每个子任务都是「可验证的」。
显式任务分解框架(3 步法)
| 检查项 | 问题 | 必须? |
|--------|------|--------|
| 1. 核心问题 | 一句话说清:用户在探究什么? | ✅ |
| 2. 预期输出 | 用户想要什么?(报告/决策/行动方案) | ✅ |
| 3. 可验证性 | 这个任务能否分解为子任务 + 有验证信号? | ✅ |
| 4. 适合性 | 这个任务是否适合认知放大器? | ✅ |
初始任务
↓
【决策点 1】这个任务是"是什么"/"为什么"/"怎么做"?
↓
├─ "是什么"(描述性)→ 分解为:定义 + 分类 + 举例
├─ "为什么"(解释性)→ 分解为:原因 A + 原因 B + 原因 C
└─ "怎么做"(规范性)→ 分解为:方案 A + 方案 B + 方案 C
↓
【决策点 2】每个子任务是否"可验证"?
↓
├─ 是 → 保留,进入第 3 步
└─ 否 → 继续分解,直到"可验证"
↓
【决策点 3】验证信号是什么类型?
↓
├─ L1(二进制):通过/不通过
├─ L2(量化):数值比较、排序、统计检验
└─ L3(语义):需要人工判断(尽量避免)
| 检查项 | 问题 | 通过标准 |
|--------|------|---------|
| 1. 验证方式 | 如何验证这个子任务完成了? | 有明确标准 |
| 2. 验证数据 | 验证需要什么数据? | 数据可获取 |
| 3. 验证来源 | 数据来源是否可靠? | 至少 2 个独立 A/B 级来源 |
| 4. 验证客观性 | 验证是否客观(不被"顺着说"污染)? | 优先 L1/L2,避免 L3 |
| 5. 验证可行性 | 当前能否验证(还是只能未来验证)? | 优先当前可验证 |
输出:子任务分解方案 + 验证信号设计 + 验证可行性评估
目标:用验证结果更新认知,调整任务/子任务,决定是否继续 Loop。
执行步骤:
| 条件 | 裁定 | 行动 |
|------|------|------|
| 后验置信度 > 85% 且连续 3 轮稳定 | 任务完成 | 输出最终报告,结束 Loop |
| 后验置信度显著上升/下降(±15%) | 继续循环 | 调整任务,回到 Step 2 |
| 连续 5 轮置信度变化 < 5% | 信息饱和 | 建议用户补充新信息源或缩小问题范围 |
| 用户主动说"停止" | 用户中止 | 输出当前最佳报告 |
触发词:"快速分析"、"简单分析"、"不用跑 Loop"
执行方式:
直接对话:适合简单问答、信息查询、闲聊,单次交互,无验证机制。
认知放大器:适合复杂分析、深度研究、决策支持,多轮 Loop,有验证机制,置信度可量化。
简化公式:
置信度 = (子任务完成数 / 子任务总数) × 0.6
+ (A/B 级来源占比) × 0.3
+ (对抗验证未发现错误 ? 0.1 : 0)
设计依据:
自动判断(满足全部条件):
适合:
不适合:
置信度 = (子任务完成数 / 子任务总数) × 0.6
+ (A/B 级来源占比) × 0.3
+ (对抗验证未发现错误 ? 0.1 : 0)
| 区间 | 含义 | 建议行动 |
|------|------|---------|
| 0-30% | 很不确定的猜测 | 需要大量证据搜集 |
| 30-50% | 有初步判断,但证据不足 | 继续 Loop,重点搜集反方证据 |
| 50-70% | 有判断,基本证据支撑 | 可以继续 Loop,或输出初步结论 |
| 70-85% | 判断较可靠,证据较充分 | 建议再跑 1-2 轮,巩固结论 |
| 85-95% | 判断很可靠,证据充分 | 可以停止,输出最终报告 |
| 评级 | 标准 | 示例 |
|------|------|------|
| A | 一手权威来源(官方文件、原始数据、同行评议论文) | 政府公告、公司年报、学术论文(DOI 可查) |
| B | 可靠二手来源(权威媒体、行业报告) | 新华社、人民日报、IDC 报告、Gartner 报告 |
| C | 有一定可信度(知名博客、专业论坛) | 知乎专栏、技术博客(有署名)、行业 KOL 微博 |
| D | 可信度不确定(需交叉验证) | 匿名论坛、个人小程序、无署名文章 |
| F | 不可靠(匿名、无出处、明显偏见) | 营销软文、标题党、明显错误信息 |
核心结论必须有至少 2 个独立 A/B 级来源交叉验证。
独立来源定义:
> 认知放大器 v3.0:将"模糊认知"转化为"可验证认知"的循环引擎——人类设定目标 + 制定验证方式,AI 路径寻找 + 循环迭代,直到任务完成。
v3.0 核心升级:
版本:3.0.0
更新日期:2026-06-12
核心升级:基于第一性原理精简重构,去掉所有历史版本号引用,统一版本标识
TRACE 评测综合评级:4.8/5(优秀)
共 5 个版本