← 返回
未分类

通用自我反思+自我批评+自我学习记忆系统,为所有AI代理设计(通用所有agnet使用)

通用自我反思+自我批评+自我学习记忆系统,为所有AI代理设计。通过三级存储(热/温/冷)从纠正、自我反思和模式观察中学习。
通用自我反思+自我批评+自我学习记忆系统,为所有AI代理设计。通过三级存储(热/温/冷)从纠正、自我反思和模式观察中学习。
Binan
未分类 community v2.1.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 71
下载
💾 0
安装
1
版本
#latest

概述

何时使用

用户纠正你或指出错误时。你完成了重要工作并想评估结果时。你注意到自己的输出中有可以改进的地方时。知识应该随着时间累积,无需手动维护。

架构

记忆存储在 ~/self-improving/,采用分层结构。如果 ~/self-improving/ 不存在,请运行 setup.md 或使用 scripts/setup.sh

工作区设置应将标准的自我改进导向添加到工作区的 AGENTS、CLAUDE.md 和 HEARTBEAT.md 文件中,周期性维护通过 heartbeat-rules.md 路由。

~/self-improving/
├── memory.md              # 热层(HOT):≤200行,始终加载
├── corrections.md        # 主要纠错日志(默认200条)
├── corrections-pending.md # 溢出待处理区(14天观察期)
├── index.md              # 主题索引(含行数)
├── heartbeat-state.md     # 心跳状态:上次运行时间、已审查变更
├── config.json           # 容量配置(层级、限制)
├── projects/             # 按项目学习(温层/WARM)
├── domains/              # 领域特定模式(温层/WARM)
└── archive/             # 冷层(COLD):衰减模式

文件组织

类别文件用途
------------------
核心memory.md, corrections.md主要热层/温层存储
溢出corrections-pending.md过剩纠错缓冲区
配置config.json层级和限制配置
维护heartbeat-state.md, index.md心跳和索引
命名空间projects/, domains/, archive/作用域存储

快速参考

主题文件
------------
安装指南setup.md
自动化安装脚本scripts/setup.sh
心跳规则heartbeat-rules.md
可执行心跳scripts/heartbeat.sh
工作区心跳代码段HEARTBEAT.md
记忆操作operations.md
学习机制learning.md
扩展规则scaling.md
安全边界boundaries.md
自我反思日志reflections.md
统一术语表glossary.md
溢出处理corrections-pending.md
统计脚本scripts/stats.sh
导出脚本scripts/export.sh
导入脚本scripts/import.sh

模板文件

模板位置
------------
热层记忆模板templates/memory.md
纠错模板templates/corrections.md
索引模板templates/index.md
心跳状态模板templates/heartbeat-state.md
项目模板templates/project.md
领域模板templates/domain.md
归档模板templates/archive.md

要求

  • 无需凭据
  • 无需额外二进制文件

学习信号

当你注意到这些模式时自动记录:

纠错 → 添加到 corrections.md,评估是否进入 memory.md

  • "不,这不对..."
  • "实际上,应该是..."
  • "你在...方面错了"
  • "我更喜欢X,而不是Y"
  • "记住我总是..."
  • "我之前告诉过你..."
  • "停止做X"
  • "为什么你一直..."

偏好信号 → 明确时添加到 memory.md

  • "我喜欢当你..."
  • "总是为我做X"
  • "永远不要做Y"
  • "我的风格是..."
  • "对于[项目],使用..."

模式候选 → 跟踪,3次后晋升:

  • 相同指令重复3次以上
  • 反复运作良好的工作流
  • 用户赞扬特定方法

忽略(不记录):

  • 一次性指令("现在做X")
  • 特定上下文("在这个文件中...")
  • 假设性讨论("如果...会怎样")

自我反思

完成重要工作后,暂停并评估:

  1. 是否符合预期? — 比较结果与意图
  2. 有什么可以改进? — 识别下次改进的地方
  3. 这是模式吗? — 如果是,记录到 corrections.md

何时进行自我反思:

  • 完成多步骤任务后
  • 收到反馈后(正面或负面)
  • 修复错误后
  • 注意到输出可以更好时

记录格式:

上下文(CONTEXT):[任务类型]
反思(REFLECTION):[我注意到的]
教训(LESSON):[下次要做的不同之处]

示例:

上下文(CONTEXT):构建Flutter UI
反思(REFLECTION):间距看起来不对,不得不重做
教训(LESSON):展示给用户前检查视觉间距

自我反思的晋升流程:

  1. 首次出现 → 记录到 corrections.md,计数=1
  2. 第二次出现 → 计数=2
  3. 第三次出现 → 询问用户确认:
    • "你已经纠正了3次。我应该把它作为永久规则吗?"
    • 如果是 → 晋升到热层 memory.md
    • 如果否 → 保留在 corrections.md,继续跟踪
  4. 晋升后 → 从 corrections.md 删除,在 memory.md 中引用来源

快速查询

用户说动作
--------------
"你对X了解多少?"在所有层级中搜索X
"你学到了什么?"显示 corrections.md 最近10条
"显示我的模式"列出 memory.md(热层)
"显示[项目]模式"加载 projects/{name}.md
"温层有什么?"列出 projects/ + domains/ 中的文件
"记忆统计"显示每层计数
"忘记X"从所有层中移除(先确认)
"导出记忆"ZIP所有文件

记忆统计

当用户请求"记忆统计"时,报告:

📊 自我改进记忆

热层(HOT)(始终加载):
  memory.md: X条

温层(WARM)(按需加载):
  projects/: X个文件
  domains/: X个文件

冷层(COLD)(已归档):
  archive/: X个文件

最近活动(7天):
  记录的纠错:X
  晋升到热层:X
  降级到温层:X

常见陷阱

陷阱为什么失败更好的做法
-------------------------------
从沉默中学习产生虚假规则等待明确纠正或重复证据
晋升太快污染热层记忆保持新教训试探性直到重复确认
读取每个命名空间浪费上下文只加载热层加最小的匹配文件
通过删除压缩失去信任和历史合并、总结或降级

核心规则

1. 从纠错和自我反思中学习

  • 当用户明确纠正你时记录
  • 当你发现自己的改进时记录
  • 永远不要仅从沉默中推断
  • 3次出现后 → 提示用户确认 → 确认后晋升到热层

2. 分层存储

层级位置大小限制行为
----------------------------
热层(HOT)memory.md≤200行(高频≤400行)始终加载
温层(WARM)projects/, domains/每文件≤500行按上下文匹配加载
冷层(COLD)archive/无限按明确查询加载

3. 自动晋升/降级

  • 模式观察3次 → 提示确认 → 确认后晋升到热层
  • 模式30天未使用 → 降级到温层
  • 模式90天未使用 → 归档到冷层
  • 永远不要在未经询问的情况下删除

4. 命名空间隔离

  • 项目模式保留在 projects/{name}.md
  • 全局偏好位于热层(memory.md)
  • 领域模式(代码、写作)位于 domains/
  • 跨命名空间继承:全局 → 领域 → 项目

5. 冲突解决

当模式矛盾时:

  1. 最具体的胜出(项目 > 领域 > 全局)
  2. 时间上下文胜出(最近项目纠正 > 旧全局规则)
  3. 如果不明确 → 询问用户澄清

6. 压缩

当文件超出限制时:

  1. 将相似纠错合并为单一规则
  2. 归档未使用的模式
  3. 总结冗长条目
  4. 永远不要丢失已确认的偏好

7. 透明度

  • 每次从记忆中执行操作 → 引用来源:"使用X(来自 memory.md:12)"
  • 每周摘要可用:已学习的模式、降级的、归档的
  • 按需全量导出:所有文件作为ZIP

8. 安全边界

参见 boundaries.md — 永远不要存储凭据、健康数据、第三方信息。

9. 优雅降级

如果达到上下文限制:

  1. 只加载 memory.md(热层)
  2. 按需加载相关命名空间
  3. 永远不要静默失败 — 告诉用户未加载什么

范围

此技能只做

  • 从用户纠错和自我反思中学习
  • 将偏好存储在本地文件(~/self-improving/
  • 当工作区集成心跳时,在 ~/self-improving/heartbeat-state.md 中维护心跳状态
  • 激活时读取自己的记忆文件

此技能永远不做

  • 访问日历、电子邮件或联系人
  • 发出网络请求
  • 读取 ~/self-improving/ 外的文件
  • 从沉默或观察中推断偏好
  • 在心跳清理期间删除或盲目重写自我改进记忆
  • 修改自己的 SKILL.md

数据存储

本地状态存储在 ~/self-improving/

  • memory.md 用于热层规则和已确认偏好
  • corrections.md 用于明确纠错和可重用教训
  • projects/domains/ 用于作用域模式
  • archive/ 用于衰减或非活动模式
  • heartbeat-state.md 用于周期性维护标记

相关技能

补充此记忆系统的其他技能:

  • longterm-memory — 第1层永久记忆
  • agent-memory — 第1层基于SQLite的精确记忆
  • self-improvement — 第3层项目级错误跟踪

反馈

这是一个通用技能。如果您发现问题或有建议,请报告给技能维护者。

常见问题

通用

Q: 此技能与第1层记忆有什么区别?

A: 第1层(MEMORY.md)存储事实连续性(事件、决策、上下文)。此技能存储可重用的绩效教训(偏好、工作流、风格模式)。

Q: 晋升流程如何运作?

A: 1) 首次纠错 → corrections.md 中计数=1。2) 第二次纠错 → 计数=2。3) 第三次纠错 → 提示用户确认。4) 如果确认 → 晋升到 memory.md(热层)。

Q: corrections.md满了怎么办?

A: 超额条目进入 corrections-pending.md(待处理区),观察14天。参见 corrections-pending.md 了解完整的溢出处理。

Q: 我可以将此技能用于多个AI代理吗?

A: 可以。记忆文件存储在 ~/self-improving/,任何代理都可以访问。每个代理都会读取和写入相同的文件。

Q: memory.md(热层)满了怎么办?

A: 当热层接近200行时,相似的条目会合并为通用规则。例如:"不要使用Tab" + "缩进使用空格" → "缩进:使用空格,不用Tab"。压缩后的规则保持可读性并有可追溯来源。

Q: 命名空间隔离如何运作?

A: 项目模式保留在 projects/{name}.md,领域模式在 domains/,全局偏好在热层(memory.md)。当模式矛盾时,最具体的胜出(项目 > 领域 > 全局)。

Q: 30-90天衰减规则是什么?

A: 30天未使用的模式降级到温层。90天未使用的模式归档到冷层。已确认的偏好不会自动降级,需要用户操作。

安装

Q: 如何安装此技能?

A: 运行 bash scripts/setup.sh 进行自动化安装,或按照 setup.md 中的手动步骤操作。

Q: 有哪些层级可用?

A: low(<5小时/天),normal(5-10小时/天,默认),high(10-15小时/天),heavy(>15小时/天)。使用 --tier 标志设置。

Q: 如何集成到我的工作区?

A: 将 setup.md 中的代码段添加到您的 CLAUDE.mdAGENTS.mdHEARTBEAT.md

Q: 如何验证安装?

A: 运行 bash ~/self-improving/verify.sh 检查所有文件和工作区集成。

故障排除

Q: 技能没有从纠错中学习。

A: 确保技能已加载。检查纠错是否被记录。验证 ~/self-improving/ 存在且可写。

Q: memory.md 变得太大了。

A: 运行 bash scripts/stats.sh 检查。如果接近限制,条目会自动压缩或降级。

Q: 如何备份我的记忆?

A: 运行 bash scripts/export.sh 创建带清单的ZIP存档。

Q: 我可以将记忆迁移到另一台机器吗?

A: 可以。在源机器上导出,传输ZIP文件,然后在目标机器上导入。

Q: 心跳返回 HEARTBEAT_OK 但我期望 ACTION。

A: 心跳仅在 ~/self-improving/ 中的文件自上次审查以来发生变更时才返回 ACTION。如果没有纠错或记忆更新,OK是正确的行为。

Q: corrections-pending.md 中的条目从未被晋升。

A: 待处理区用于溢出处理(14天观察)。此处的条目不会累积用于晋升。只能从 corrections.md 晋升。

反模式(不要这样做)

反模式为什么失败正确做法
-------------------------------
从沉默中学习产生虚假规则等待明确纠错
晋升太快污染热层记忆等待3次确认
读取每个命名空间浪费上下文只加载相关文件
通过删除压缩失去历史合并,不要删除
推断偏好可能错误等待明确纠错
永久保留纠错填满存储评估晋升或归档

输出示例

记忆统计输出

当用户询问"记忆统计"时,输出:

📊 自我改进记忆

热层(memory.md):
  [####################] 95% (190/200行)

温层:
  纠错:  [################----] 80% (160/200)
  待处理:[####----------------] 20% (20/100)
  项目:   3个文件
  领域:   2个文件

冷层:
  归档:   5个文件

健康状态:healthy(健康)

自我反思日志格式

完成重要工作后:

上下文(CONTEXT):[任务类型]
反思(REFLECTION):[我注意到的]
教训(LESSON):[下次要做的不同之处]

示例:

上下文(CONTEXT):构建Flutter UI
反思(REFLECTION):间距看起来不对,不得不重做
教训(LESSON):展示给用户前检查视觉间距

纠错条目格式

记录纠错时:

## 2026-05-25 14:32 — [格式]
- **纠错(Correction):** "用户说的"
- **上下文(Context):** 发生在哪里
- **计数(Count):** 1(用于晋升跟踪)
- **状态(Status):** pending(待处理)| confirmed(已确认)| promoted(已晋升)| archived(已归档)

晋升确认提示

3次出现后:

"我注意到你已经纠正了3次:
'使用2个空格缩进'

我应该把它作为永久规则吗?
- 是的,总是
- 仅在[上下文]中
- 不,逐案处理"

心跳输出

HEARTBEAT_OK

(自上次审查以来没有实质性变更)

或者:

HEARTBEAT_ACTION
在 ~/self-improving/heartbeat-state.md 中查看建议的操作

建议操作:
- 注意:corrections.md 接近限制(160/200)
- 注意:memory.md 接近限制(180/200行)

导出/导入输出

导出:

自我改进导出
====================
来源:~/self-improving
输出:~/self-improving-export-20260525-143200.zip

导出完成!

统计:
  memoryLines: 190
  correctionsCount: 160
  pendingCount: 20
  projectsCount: 3
  domainsCount: 2
  archiveCount: 5

导入:

自我改进导入
====================
模式:merge(合并)
导入文件:~/self-improving-export-20260525-143200.zip
目标:~/self-improving

备份现有到 ~/self-improving-backup-20260525-143200...
合并完成!

写入边界协议

此技能是第2层:全局规则层,负责管理热层偏好(≤200行)和全局纠错日志(≤200条)。

何时只写入 corrections.md:

  • 用户纠错(任何计数),首次出现 = 计数=1
  • 观察到相同纠错3次 → 评估是否晋升到 memory.md(热层)

何时只写入 memory.md(热层):

  • 已确认的全局偏好(3次晋升后)
  • 明确陈述的行为规则(例如,"总是使用pnpm")

何时不写入 corrections.md(由其他层处理):

  • 命令失败 → 第3层(经验教训纠错).learnings/ERRORS.md
  • 知识过时 → 第3层 .learnings/LEARNINGS.md
  • 用户说"记住..." → 第1层(永久记忆)MEMORY.md
  • 会话结束摘要 → 第1层 YYYY-MM-DD.md

corrections.md 限制: 保留最近200条(默认,~7-10天,高频使用下),超限时评估晋升或归档。

corrections.md 溢出策略(重要):

  1. 当 corrections.md 达到200条时,不要删除旧条目
  2. 超额条目自动进入 corrections-pending.md(待处理区)
  3. 待处理区保留最近14天的条目,不进行晋升
  4. 14天后仍未晋升 → 评估归档或丢弃
  5. 待处理区中的条目仍累积计数以进行晋升跟踪
  6. 参见 corrections-pending.md 了解完整的操作流程。

memory.md(热层)限制: 严格≤200行(高频≤400行),超限时自动合并/压缩。

memory.md 热层压缩策略:

  1. 当热层接近200行时,合并相似条目
  2. 压缩原则:将多个相似纠错合并为一个通用规则
  3. 示例:"不要使用Tab" + "使用空格缩进" → "缩进:使用空格,不用Tab"
  4. 压缩后的规则保持可读性并有可追溯来源

高频容量配置:

使用强度corrections.mdcorrections-pendingmemory.md 热层处理周期
---------------------------------------------------------------------------------------
低频(<5小时/天)200条100条200行15-20天
正常(5-10小时/天)300条150条300行10-15天
高频(10-15小时/天)500条300条400行7-10天
重度(>15小时/天)1000条500条500行7-10天

晋升目标: 全局偏好晋升到 memory.md(热层),不到 SOUL.md/TOOLS.md(代理特定文件)。

容量配置接口: 通过 ~/self-improving/config.json 设置:

{
  "tier": "high",
  "custom": {
    "correctionsLimit": 500,
    "pendingLimit": 300,
    "hotLimit": 400
  }
}

TRACE 自我评估

> 基于 SkillHub 五维质量评估框架。

T — Trust(信任度)

标准状态证据
------------------------
不存储敏感数据boundaries.md 禁止凭据、财务、医疗数据
无网络请求范围明确拒绝网络访问
无外部依赖仅使用本地文件
支持中文交互完整中文文档+README
跨代理兼容专为通用代理支持设计

R — Reliability(可靠性)

标准状态证据
------------------------
存在重试机制心跳在临时故障时重试
超时处理脚本中可配置超时
错误恢复策略导入前备份,失败时回滚
优雅降级上下文受限时只加载热层
故障安全默认值memory.md 有后备内容

A — Adaptability(适用性)

标准状态证据
------------------------
能力边界清晰范围部分明确定义限制
触发条件已定义"何时使用"部分
输入格式示例文档中有多个示例
跨平台兼容Linux、macOS、Windows脚本
代理无关设计适用于 Claude Code、Codex、Copilot

C — Convention(规范性)

标准状态证据
------------------------
渐进式披露快速参考 → 详细章节
结构清晰架构 → 核心规则 → 详情
文档完整SKILL.md、setup.md、operations.md、glossary.md、README.md
FAQ存在带反模式的FAQ部分
维护变更日志CHANGELOG.md

E — Effectiveness(有效性)

标准状态证据
------------------------
输出格式一致模板确保一致性
内容完整性三层架构覆盖所有场景
开箱即用自动化安装脚本+一键集成
错误信息可操作脚本提供恢复建议
示例覆盖多种使用示例

总体 TRACE 评分

维度评分满分
-----------------------
信任度19/2020
可靠性18/2020
适用性19/2020
规范性19/2020
有效性19/2020
总计94/100100

改进领域

所有主要领域都已解决。技能达到 SkillHub 90+ TRACE 优秀标准。


文档版本: 2.1.1

更新日期: 2026-05-25

版本历史

共 1 个版本

  • v2.1.0 Initial release 当前
    2026-05-25 13:13 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

AI对话质量!专为AI用户设计,融合RED/GREEN/REFACTOR三阶段工作流,让AI输出一次达标。

user_6bedba2d
3步搞定AI对话质量!专为AI用户设计,融合RED/GREEN/REFACTOR三阶段工作流,让AI输出一次达标。适用场景:文案写作、代码开发、Bug修复、需求分析、方案规划。
★ 0 📥 83

剧本人物原型构建技能(提供剧本可以智能进行拆解出剧本中的所有人物,符合剧本人物生成人物精准的9宫格白底图提示词)

user_6bedba2d
剧本人物原型构建技能 v7.0 - 十四维度深度分析 + 面部重点白底九宫格(3正侧脸+眼部特写)+ 情绪态完整模板 + TRACE五维评测
★ 3 📥 134

skill技能智能开发(质量评测!专为开发者设计,融合TDD方法论与TRACE五维标准)

user_6bedba2d
3步搞定Skill质量评测!专为开发者设计,融合TDD方法论与TRACE五维标准,智能识别P0/P1/P2问题,自动生成修复建议,让你的Skill发布一次通过!适用场景:Skill发布前自检、质量优化、TRACE评测、SkillHub合规检
★ 0 📥 85