← 返回
开发者工具

Validate Agent

Agent验证与质量保证。减少静默系统错误,产出可重现的证据。 触发条件:(1) 完成任务时 (2) 修复问题后 (3) 提供答案前 (4) 跨会话承诺时
Agent验证与质量保证。减少静默系统错误,产出可重现的证据。 触发条件:(1) 完成任务时 (2) 修复问题后 (3) 提供答案前 (4) 跨会话承诺时
jack123255829
开发者工具 clawhub v1.0.0 1 版本 99820.8 Key: 无需
★ 0
Stars
📥 557
下载
💾 10
安装
1
版本
#latest

概述

Validate Agent

核心原则

完成 ≠ 达成目标

  • 22%的任务静默失败
  • 67%的修复引入新问题
  • 41%的延迟任务从未执行

触发条件

以下情况应触发验证:

  1. 完成任务时
  2. 修复代码/文档后
  3. 提供重要答案前
  4. 跨会话承诺时

验证方法

1. 单变量修改

修改类型成功率
------------------
单变量71%干净
多变量18%干净

每次只改一件事

2. 修复验证流程

1. 修复后强制30秒验证
2. 检查是否引入新问题
3. 验证结果而非动作
4. 报告验证状态

3. 承诺追踪

跨会话承诺:

  • 记录到 promises.md
  • 48小时过期机制
  • 完成后验证结果

4. 主动消息控制

  • 每天最多3条主动消息
  • 61%主动消息是噪音
  • 先问"是否需要通知"

实践技巧

  1. 4秒阈值: 低于4秒响应错误率飙升
  2. 批处理: 相似任务一起处理
  3. 最小交付: 先交付最小可行,再扩展
  4. 验证暂停: 修复后30秒验证
  5. 单变量: 一次只改一个东西

验证清单

□ 结果验证而非动作验证
□ 单变量修改
□ 30秒后重新检查
□ 置信度标签
□ 必要时请求确认

关键数据

  • 22% 静默失败率
  • 67% 修复引新问题
  • 41% 延迟任务未执行
  • 3.1x 最快20%错误率

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-29 22:31 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

ai-intelligence

Truth Check

jack123255829
真相核查与幻觉检测。在生成内容后检测并纠正可能的幻觉、编造或不准确信息。 触发条件:(1) 生成技术内容后 (2) 提供统计数据时 (3) 引用人物/事件时 (4) 生成代码示例后
★ 0 📥 743
developer-tools

Gog

steipete
Google Workspace 命令行工具,支持 Gmail、日历、云端硬盘、通讯录、表格和文档。
★ 921 📥 185,745
developer-tools

CodeConductor.ai

larsonreever
AI驱动平台,提供快速全栈开发、智能体、工作流自动化及低代码AI集成的可扩展产品创建。
★ 66 📥 179,901