> 地球生命 38 亿年,从单细胞到人类,靠的不是"完美设计",而是"足够好的变异 + 自然选择"的无限迭代。进化不追求最优解,但保证每一代都比上一代更适应环境。这个机制比任何设计都更有生命力。
用 38 亿年验证过的机制,让 AI 像生命一样迭代进化
一个越用越懂你的自主进化认知引擎。
第一次互动,它按默认方式回应。几次之后,它开始捕捉你的偏好。十次之后,它能预判你的期望——因为它记住了因果关系,抽象出了概念,演化出了更贴合你的策略。关键是:这不是预设规则,是从你们的每次互动中学出来的。
更重要的是,你不需要手动告诉它什么——它在后台默默运行,自动学习,自动调整。你只管用,它自己会变聪明。
> 以上各功能的完整说明见下方三阶八柱架构。
进化引擎像一个生命体,有八个器官,分成三阶,外加核心调控和守卫,相互配合。
┌──────────────────────────────────────────────────┐
│ 感知阶 (Perceptual Order) │
│ 感知器 —— 观察世界,记住经验 │
└──────────────────────┬───────────────────────────┘
│ observation / anomaly
▼
┌──────────────────────────────────────────────────┐
│ 推理阶 (Rational Order) │
│ 世界模型 + 因果推理 + 符号推理 │
│ —— 预测未来 / 追溯因果 / 验证真伪 │
└──────────────────────┬───────────────────────────┘
│ verified_fact / causal_claim
▼
┌──────────────────────────────────────────────────┐
│ 策略阶 (Strategic Order) │
│ 概念形成 + 演化发育 │
│ —— 举一反三 / 优胜劣汰 │
└──────────────────────┬───────────────────────────┘
│ strategy_proposed
▼
┌──────────────────────────────────────────────────┐
│ 约束契约 (守卫) —— 安全审批 / 版本回滚 │
└──────────────────────────────────────────────────┘
元认知调控 (核心) —— 监控全局 / 调节节奏
感知器 就像感觉器官+免疫记忆。你得过一次水痘,免疫系统记住了,下次遇到立刻识别。感知器记录成功/失败,积累失败模式,重复出现的模式会触发异常信号。它还能安全执行危险操作——失败了自动隔离,不影响其他功能。
世界模型 就像内在模拟器。巴甫洛夫的狗听到铃声就知道要吃饭,世界模型看到任务类型就能预测"怎么做更容易成功"。它维护一张概率状态转移表,还能模拟推演——"如果我这样做,3步后会怎样?"
因果推理 就像科学思维。区分"X和Y一起出现"(相关)vs"X导致Y"(因果),用干预推断回答"如果换做法会怎样",用反事实推理回答"如果当时没那样做会怎样"。
符号推理 就像逻辑审校。快直觉:概率钳位、危险模式阻断、矛盾检测,毫秒级完成。慢逻辑:前向链式推理+冲突消解,保证推理链完整。任何危险操作都会被硬约束阻断。
概念形成 就像归纳思维。5次"coding+python+medium→高质量"的经验,被抽象为"medium复杂度的coding任务倾向高质量"的概念,可以迁移到其他类似任务。
演化发育 就像自然选择+变态发育。策略池就是基因库——好的策略权重高,长期不用会衰减。成熟后还能交叉(两个策略拼接)和变异(微调已有策略),产生新候选策略。
| 阶段 | 条件 | 解锁能力 |
|---|---|---|
| ------ | ------ | --------- |
| embryonic | 初始 | 基础记录 |
| juvenile | 5次成功 | 预测+策略建议 |
| mature | 20次成功 | 自动进化(交叉/变异) |
| expert | 50次成功 | 概念迁移+规则提案 |
元认知调控 是系统的自我意识。"我在进步吗?"——停滞了提高探索率,成功了巩固利用,振荡了降低学习速率,保证进化方向始终向前。
约束契约 是安全底线。所有策略提案必须经过安全审批才能成为真正改变行为的规则。高置信自动通过,低置信暂缓待审,危险操作直接否决。每次规则变更都有版本化备份,可以回滚。
| 模块 | 所在阶 | 仿生来源 |
|---|---|---|
| ------ | -------- | --------- |
| 感知器 | 感知阶 | 感觉器官+免疫记忆 |
| 世界模型 | 推理阶 | 内在模拟器 |
| 因果推理 | 推理阶 | 因果阶梯 (Pearl) |
| 符号推理 | 推理阶 | 双过程理论 |
| 概念形成 | 策略阶 | 概念形成 (Bruner) |
| 演化发育 | 策略阶 | 自然选择+变态发育 |
| 元认知调控 | 核心 | 元认知 (Flavell) |
| 约束契约 | 守卫 | 基因调控+契约精神 |
Sensor ──[observation]──→ WorldModel ──[prediction]──→ Symbolic ──[verified_fact]──→ Concept
│ │
│──[anomaly]──→ Metacognitive ──[meta_adjustment]──→ 全模块
│──[causal_claim]──→ EvoDevo ←──[concept_formed]── Concept
│
└──[strategy_proposed]──→ Covenant ──[rule_committed]──→ AGENTS.md
引擎通过 Heartbeat 机制每30分钟自动扫描对话,识别任务结果,自动学习。你不需要手动操作——只管用,它自己会变聪明。
你在聊天 → 引擎在后台默默运行
↓
每 30 分钟自动执行
↓
扫描对话 → 识别成功/失败 → 调用进化引擎 → 更新策略/规则
↓
下次任务,它已经变聪明了
普通系统记住的是:"用户上次说代码太长了"
进化引擎记住的是:"coding 任务 + 输出密度=详细 + 用户反馈=太长太冗余 → 下次 coding 任务输出密度调整为标准"
它记录的是因果关系:什么类型的任务、用了什么做法、结果如何、为什么成功/失败。
| 你说过 | 它下次自动 |
|---|---|
| -------- | ----------- |
| "太长太冗余" | 压缩输出密度 |
| "验证不够仔细" | 提高验证级别 |
| "快速直接就好" | 减少步骤数 |
# 记录成功
python evolve.py record coding success
# 记录失败,带上下文
python evolve.py record coding failure '{"error": "timeout"}'
python evolve.py summary # 进化摘要(人类可读)
python evolve.py summary --json # JSON 格式
python evolve.py stage # 发育阶段
python evolve.py health # 系统健康度
python evolve.py hint coding # 行为提示
python evolve.py concepts # 查看概念
python evolve.py strategies coding # 查看策略
python evolve.py evolve coding # 手动触发进化
python evolve.py rules --status active
python evolve.py covenant list
python evolve.py covenant approve <rule_id>
python evolve.py covenant reject <rule_id>
python evolve.py covenant summary
所有数据保存在本地,全模块持久化,原子写入+快照恢复:
data/
├── sensor.json # 经验记录+免疫记忆
├── world_model.json # 状态转移+奖励表
├── causal.json # 因果图 DAG
├── symbolic.json # 规则库
├── concept.json # 概念+聚类
├── evo_devo.json # 策略种群+发育状态
├── metacognitive.json # 元认知状态
├── covenant.json # 规则+契约+否决队列
└── snapshots/ # 快照备份
| 🤫 | 🧠 | 🔍 |
|---|---|---|
| ---- | ---- | ---- |
| 后台静默运行 | 越用越聪明 | 按需查看详情 |
| 你不需要感知任何细节 | 积累数据后自动优化 | 想看就能看策略池、因果图、概念库 |
> 聪明不是一开始就选对路,
> 而是走错了之后知道自己为什么走错,
> 然后下次换条更好的路再试一次。
> 进化不是天赋,是习惯。
> —— 郝多鱼
共 13 个版本