← 返回
未分类

self-evolving-core

Agent自进化能力 — 让AI同一个坑只踩一次。 自动记账+阈值检测+自动经验提取闭环+免疫规则+全链路无截断,开箱即用。 核心能力:log→R1/R2/R3自动动作→auto-review自动提取经验→写入JSON→Router加载生效。 学习环真正闭合,无需人工干预。数据存储零截断,信息完整保留。
Agent自进化能力 — 让AI同一个坑只踩一次。 自动记账+阈值检测+自动经验提取闭环+免疫规则+全链路无截断,开箱即用。 核心能力:log→R1/R2/R3自动动作→auto-review自动提取经验→写入JSON→Router加载生效。 学习环真正闭合,无需人工干预。数据存储零截断,信息完整保留。
赞的嘞
未分类 community v5.2.0 10 版本 99200 Key: 无需
★ 0
Stars
📥 124
下载
💾 0
安装
10
版本
#latest

概述

🧬 Self-Evolving-Core v5.2.0 — Agent自进化能力

> 让Agent拥有"同一个坑只踩一次"的记忆力。

>

> 核心能力:学习环闭合 + 数据零截断 + 双地同步


⚡ 30秒上手

3条铁律,记住就行

① 安装/升级:python3 {SKILL_PATH}/scripts/upgrade_agent.py --deploy

② 每次任务结束 → log:
   python3 domains/_shared/evolution_guardian.py log <domain> "<任务>" <success|failed|partial>

③ ★ 不需要手动review了!
   log每3次 → R1自动触发 → auto-review自动提取经验 → 写入experiences.json

> AI只需做一件事:执行log。其余全自动。


1. 核心概念

1.1 工作流闭环

用户给任务 → Router路由(经验+免疫预检) → AI执行 → log记账
                                                    ↓
                                              每3次任务(R1)
                                                    ↓
                                           auto-review [自动!]
                                                    ↓
                                         扫描最近N条任务日志
                                                    ↓
                                    ┌───────────────┴───────────────┐
                                    ▼                               ▼
                              成功×≥2次                        含失败
                              L2程序性经验                    L2教训+免疫规则
                                    ↓                               ↓
                              experiences.json              immune_rules.json
                                    └───────────────┬──────────────┘
                                                  ↓
                                    下次Router加载时自动生效

1.2 四条进化规则(log自动检测+自动执行)

规则触发条件输出自动行为
------------------------------
R13次任务📊自动执行 review --auto 提取经验
R2同类连续失败≥2次🔴 CRITICAL自动执行完整review + 免疫规则提取
R3≥1条负面反馈⚠️ CRITICAL输出根因分析提醒
R4MEMORY.md>200行📋提示运行distill蒸馏

1.3 四层记忆

层级存什么位置写入方式
-----------------------------
L1 陈述性URL、配置、命名规则experiences.json手动 / distill
L2 程序性⭐已验证步骤、最佳实践experiences.json★ auto-review自动
L3 语义错误模式、根因链experiences.json★ auto-review自动
L4 工作当前会话方法l4-memory.jsonSession内临时

1.4 免疫规则

Router每次任务前自动预检

级别行为
------------
🔴 critical必须先确认再行动
🟡 warning有意识绕开
🔵 info可选优化

1.5 数据完整性保证(★ 第三轮审计核心修复)

所有数据存储路径零截断

字段旧行为当前行为
-----------------------
scenario (experiences)task[:80] 截断✅ 完整保留
scenario (immune_rules)task[:80] 截断✅ 完整保留
source_lessontask[:40] 截断✅ 去掉task引用
lesson (evolution.log)[:80] 截断500字符
hint (Router输出)[:300]/[:200]✅ 完整输出

2. 命令参考

入口:python3 domains/_shared/evolution_guardian.py

2.1 log — 任务记账(★ 唯一必做的操作)

# 基础用法
log <domain> "<task>" <success|failed|partial>

# 完整用法
log <domain> "<task>" <result> [error_type] [error_category] [tokens] [duration_sec]

# 失败时附带教训(直接写experiences+immune_rules)
log data "API超时" failed timeout API --lesson="需要加retry机制"

# ★ v5.1新增: trace和context参数(GEPA思想)
log data "任务" success --trace="tool1→tool2→tool3" --context="因为X选择Y方案"

关键行为

  • 新域自动创建目录(不再拒绝)
  • ★ v5.1: 新域自动注册到Router的index.json(域名作为触发词)
  • 成功后自动检查R1-R4并执行对应动作
  • R1触发时立即自动执行 review --auto(异步,日志写入auto-review.log)
  • ★ v5.1: 耗时自动计算(从上次log时间推算)
  • ★ v5.1: token显示N/A(无法自知时不显示误导性的0)

2.2 review — 复盘(★ 自动经验提取引擎)

review <domain>         # 完整报告模式(详细输出每组任务分析)
review <domain> --auto  # 轻量自动模式(R1调用,单行摘要)

提取算法

输入: recent_tasks(20条) + evolution.log(全部历史)
  ↓
按 _normalize_task_type() 聚类分组
  ↓
┌────────────────────┬──────────────────────┬──────────────┐
│ 成功组 × ≥2次      │ 含失败记录            │ 单次/混合     │
│ → L2程序性经验      │ → L2教训 + 免疫规则    │ → 跳过       │
│ 置信度 0.5~0.95    │ 置信度固定 0.8        │ 样本不足      │
└────────────────────┴──────────────────────┴──────────────┘
  ↓
与已有 experiences.json 去重(单字级token重叠>=85% = 已存在;50-85%冲突窗口标记旧经验deprecated)
  ↓
写入新经验和规则

2.3 check — 域诊断

check <domain>    # 文件完整性 / 经验库 / 任务统计 / 免疫系统

2.4 evolve / feedback / distill / archive-logs / experience-update / hot-experiences / decay

evolve <domain> "原因描述"
feedback admin negative <strong|medium|mild> "<触发词>" "<上下文>"
distill --from-daily    # 每日日志→STM
distill --from-stm      # STM→MEMORY.md
distill                 # 仅应急:MEMORY超200行
archive-logs [--days=N] [--dry-run]
experience-update <domain> <id> <deprecate|supersede> [new_id]

# ★ v5.1 新增
hot-experiences [数量]   # 输出所有域中最高价值经验(供session初始化)
decay [--dry-run]        # 经验置信度衰减(>30天+proven<=1 → conf-=0.1; <=0.3→deprecated)

3. 目录结构

项目根目录/
├── domains/
│   ├── _shared/
│   │   ├── evo-config.json           ← 全局配置(阈值)
│   │   ├── evolution_guardian.py     ← ★ 统一入口
│   │   ├── domain_router.py         ← 领域路由引擎
│   │   ├── evo-feedback.json        ← 反馈记录
│   │   └── admin-experiences.json   ← 跨域共享经验
│   │
│   └── <域名>/                       ← 中文语义命名(禁止hash/英文缩写)
│       ├── experiences.json          ← review自动写入
│       ├── memory.json               ← 统计(recent_tasks等)
│       ├── immune_rules.json          ← review自动写入
│       └── evolution.log             ← 进化日志(Review的数据源之一)
│
├── memory/                              ← 记忆目录(IDE无关,部署时自动发现或创建)
│   ├── MEMORY.md                     ← 长期元层(<200行,含PINNED强制校验区)
│   ├── short-term-memory.md          ← STM缓冲
│   ├── YYYY-MM-DD.md                 ← 每日日志
│   └── archive/                      ← 归档
│
└── workspace/.tmp/l4-memory.json      ← Session临时

4. 双地同步规则(★ 关键)

修改以下3个文件后必须双地同步

#文件工作副本位置skill源码位置
------------------------------------
1evolution_guardian.pydomains/_shared/{SKILL_HOME}/self-evolving-core/scripts/
2domain_router.py同上同上
3evo-config.json同上同上

> {SKILL_HOME} = 你使用的IDE的skill安装目录。WorkBuddy: ~/.workbuddy/skills/;Cursor: ~/.cursor/skills/;其他IDE请查阅对应文档。

为什么? 新工作空间部署时从 skill 源码复制文件到工作副本。不同步 = 新工作空间拿到旧版 bug。

验证命令

diff domains/_shared/evolution_guardian.py {SKILL_HOME}/self-evolving-core/scripts/evolution_guardian.py
# 期望输出:空(完全一致)

5. MEMORY.md 规范(★ 纯净性原则)

5.1 PINNED 区强制内容

MEMORY.md 顶部 之间为永驻区,蒸馏不会删除。必须包含:

  • 🔴 沟通规范(称呼/语调/执行原则)
  • 🔴 运行模式(Domain框架唯一模式)
  • 🔴 核心操作纪律P0(路由→log→自检)
  • 🔴 批判性思维规则
  • 🔴 项目目录管理规则(中文命名)
  • 🔴 领域经验管理规则(保存位置/创建方式/双地同步)

5.2 纯净性要求

规则说明
------------
❌ 禁止写版本号不含 v5.0.0 / v4.6.2 等,冗余无实际意义
❌ 禁止存具体经验原文只存路径指针(如 domains/data/experiences.json
❌ 禁止存项目具体内容项目信息只存在 workspace/<中文项目名>/ 目录下
✅ 只存规范+索引+指针MEMORY = 元知识层,不是笔记本

6. 域管理规则

6.1 域命名

✅ 正确❌ 错误
-----------------
奖项申报topic_e5e22d
数据定级whitelist_data_q
聚源数据dd_gildata_com
cos内网cos(太短无语义)

6.2 域创建方式

方式触发条件行为
---------------------
Router动态创建任务匹配不到已有域自动分析语义→建域+注册index.json
log自动创建cmd_log传入不存在域名创建目录+基础文件,回退_shared
手动--deployupgrade_agent.py --deploy从模板批量初始化静态域

7. 部署与升级

7.1 首次部署(新项目)

python3 {SKILL_PATH}/scripts/upgrade_agent.py --deploy [--root <目录>] [--yes]

自动完成:识别架构 → 创建域 → 注入钩子 → 整理MEMORY.md → 架构优化建议

7.2 从旧版升级(已部署用户)

Step 1: 从skill源码覆盖3个核心文件到工作副本

cp {SKILL_HOME}/self-evolving-core/scripts/evolution_guardian.py \
   <项目>/domains/_shared/evolution_guardian.py
cp {SKILL_HOME}/self-evolving-core/scripts/domain_router.py \
   <项目>/domains/_shared/domain_router.py
cp {SKILL_HOME}/self-evolving-core/scripts/evo-config.json \
   <项目>/domains/_shared/evo-config.json

Step 2: 更新 MEMORY.md(手动,不可覆盖)

  • 去掉PINNED区外的版本号
  • 前补全「领域经验管理规则」章节

Step 3: 验证

python3 domains/_shared/evolution_guardian.py check _shared
python3 domains/_shared/evolution_guardian.py log _shared "升级验证" success "" ""

> 详细升级步骤见:自进化系统升级提示词-v5.1.0.md(skill 目录下)


8. 经验质量与去重

8.1 经验质量分级

来源Layer初始置信度说明
------------------------------
--lesson 参数L20.7用户明确标注的教训
auto-review 成功模式L20.5~0.95出现次数越多置信越高(≥6次=0.95)
auto-review 失败教训L20.8失败记录自带高价值
distill 下沉L20.6从MEMORY.md提炼的通用内容

8.2 去重保护与冲突检测

  • 精确匹配: scenario完全相同 → 跳过
  • 模糊匹配: 单字级token重叠 >= 85% → 视为已存在 → 跳过(短文本<3 token保护:跳过模糊匹配)
  • 冲突检测: 50-85%重叠窗口 → 旧经验标记deprecated + 新经验增加supersedes链
  • 防止同类经验反复堆积,同时保证新认知能替代过时经验

8.3 experiences.json Schema (v5.2)

{
  "id": "lesson_xxx_0",
  "status": "active|deprecated",
  "layer": "L2",
  "scenario": "任务描述(完整,不截断)",
  "keywords": ["关键词", "keyword_en"],
  "lang": "zh|en|mixed",
  "steps": ["教训: xxx"],
  "insight": "经验核心内容",
  "trace": "tool1→tool2→tool3(决策路径)",
  "context": "因为X所以选择Y方案",
  "why_failed": "error_type(失败原因分类)",
  "confidence": 0.7,
  "proven_count": 1,
  "superseded_by": null,
  "supersedes": ["被本经验替代的旧经验id列表"],
  "source_task": "原始任务描述",
  "agent": "admin",
  "tags": ["from_log_lesson", "failure"],
  "timestamp": "2026-05-19T14:00:00",
  "updated_at": "2026-05-19T14:00:00"
}

9. 记忆管理(三段式蒸馏)

每日日志 → distill --from-daily → STM新内容区
  → distill --from-stm → MEMORY.md(PINNED区之后)
  → distill(仅应急) → experiences.json
场景操作自动?
------------------
每次任务结束log手动执行
每3次任务auto-review★全自动
每日工作结束distill --from-daily手动
STM>20行distill --from-stm手动
R4触发(MEMORY>200行)distill手动
每月维护archive-logs手动

10. 配置参考

domains/_shared/evo-config.json:

{
  "consecutive_error_threshold": 2,
  "review_every_n_tasks": 3,
  "negative_feedback_threshold": 1,
  "memory_line_threshold": 150,
  "stm_distill_threshold": 20,
  "log_archive_days": 15
}

11. 禁止行为

  • ❌ 不执行log记账
  • ❌ 连续使用失败方法超过2次
  • ❌ 忽略log输出的🔴/📊/⚠️/📋行动指令
  • ❌ 数据类任务编撰/默认填充值(查不到→置空Null)
  • ❌ log输出出现🔄Auto-Review后不确认是否成功执行
  • ❌ 修改核心脚本后不同步到skill源码(双地一致是硬性要求)
  • ❌ 用hash/英文无意义命名创建新城
  • ❌ 在MEMORY.md中写入具体经验原文或版本号

12. FAQ

问题解决
------------
log报目录不存在检查是否已deploy;或新域名会自动创建
check显示缺失跑一次 log <该域> 即可自动创建
Router返回null域用默认身份执行
MEMORY.md超限distill --dry-run 后执行
auto-review没提取到经验正常——样本不足时会跳过,继续积累即可
经验重复写入不会——去重保护(>=85%单字级匹配) + 冲突检测(50-85%标记deprecated)
两边文件不一致以skill源码为准cp覆盖,再验证diff=0
升级后旧数据丢失不会——运行时JSON不受影响

13. 版本历史

版本核心变更
---------------
★ v5.2.0跨语种经验检索:新增_detect_language语种检测;_extract_keywords智能关键词提取(中文2-4字词组/英文3+字母);_expand_bilingual 200+术语双语映射自动扩展;Router检索query双语扩展+insight字段匹配(权重2);所有4个写入点自动生成高质量keywords+lang字段;存量44条空keywords一次性修复
★ v5.1.023项优化:统一路径解析器_resolve_paths;log增加--trace/--context(GEPA思想);去重阈值60%→85%+冲突检测50-85%;R1异步subprocess+日志;R2增强error_cat维度;新增hot-experiences/decay命令;域自动创建同步注册Router;Router兜底匹配域目录名;耗时自动计算;immune_rules增timestamp
★ v5.0.0 (第三轮)全面审计修复16个问题:全链路截断清除(9处);cmd_review新域兼容;MEMORY.md纯净性(去版本号+补全领域管理规则);evo-config纳入双地同步;双保险架构(R1/R2/R3全自动)
★ v5.0.0 (第二轮)R2/R3触发后自动执行(不再仅打印);新域log自动创建;lesson字段80→500字符;Router hint去截断;evo-config补全域注册
★ v5.0.0 (首轮)闭环学习系统:cmd_review从空壳print重写为自动经验提取引擎;R1触发→auto-review自动执行;双数据源融合;智能聚类+去重保护
v4.6.8第三轮深度白盒审计修复10个隐藏bug(feedback参数/archive-params/distill日期/跨域判定/原子写)
v4.6.5项目目录管理规则;Memory阈值200行
v4.6.2解决"第二天失效"根因:PINNED保护区+强制log注入
v4.6.0精细化域推断(12种任务模式聚类);精准经验提取
v4.5.4钩子触发条件扩展为14类具体动作
v4.5三段式蒸馏固化;MEMORY.md置顶保护区;STM分区隔离
v4.4MEMORY.md生命周期治理;安全写入;日志归档
v4.1log内置阈值自检引擎(R1-R4)
v4.0Domain大一统架构;Router内嵌检索

"好的Agent不是不犯错,而是同一个坑只踩一次——而且越踩越聪明。"

版本历史

共 10 个版本

  • v5.2.0 增加支持多语种经验积累(理论上...ORZ...) 当前
    2026-05-22 14:34 安全
  • v5.1.1 Initial release
    2026-05-22 10:11 安全
  • v5.1.0 石头剪刀布输给了镜子里的自己,所以全面排查修复了一轮bug
    2026-05-20 15:52 安全
  • v5.0.1 修复了一些已知bug,例如上传错文件了……
    2026-05-13 16:29 安全 安全
  • v5.0.0 全面检查并修复了一堆bug,并狠狠地给桌面一个肘击
    2026-05-13 16:10 安全
  • v4.6.8 Initial release
    2026-05-12 15:57 安全 安全
  • v4.6.5 首次部署时强制更新memory文件中的核心规则:任务执行前检索领域知识、执行后强制log记账、达到条件自动总结经验。
    2026-05-09 11:38 安全 安全
  • v4.6.0 优化自主拆分知识领域规则,并给键盘一个佳木斯大拐
    2026-05-07 16:51 安全
  • v4.5.5 Initial release
    2026-05-07 10:11 安全 安全
  • v4.5.4 修复了已知bug,并弹了自己一个脑瓜崩
    2026-05-06 20:06 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

suspicious
查看报告

🔗 相关推荐

security-compliance

Skill Vetter

spclaudehome
AI智能体技能安全预审工具。安装ClawdHub、GitHub等来源技能前,检查风险信号、权限范围及可疑模式。
★ 1,218 📥 266,731
ai-intelligence

self-improving agent

pskoett
捕获经验教训、错误和纠正,以实现持续改进。使用时机:(1)命令或操作意外失败;(2)用户纠正……
★ 4,060 📥 798,720
developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 672 📥 324,405