← 返回
未分类

darwin-skill

达尔文.skill 2.0 — 自主Skill优化系统:评估→改进→测试→保留或回滚。与女娲.skill配合使用:女娲造人(创建Skill),达尔文进化(优化Skill)。集成微软SkillLens 9维评分+SkillOpt验证机制
达尔文.skill 2.0 — 自主技能优化系统:评估→改进→测试→保留或回滚。与女娲.skill配合:女娲造人(创建技能),达尔文进化(优化技能)。集成微软SkillLens 9维评分+SkillOpt验证机制
dxy0905
未分类 clawhub v2.0.0 1 版本 99248.1 Key: 无需
★ 0
Stars
📥 132
下载
💾 1
安装
1
版本
#latest

概述

达尔文.skill 2.0 — Skill进化系统

> 核心理念:评估 → 改进 → 实测验证 → 保留或回滚

> 配合女娲.skill使用:女娲造人(创建Skill),达尔文进化(优化Skill)

设计哲学

  1. 单一可编辑资产 — 每次只改一个SKILL.md
  2. 双重评估 — 结构评分 + 效果验证
  3. 棘轮机制 — 只保留改进,自动回滚退步
  4. 独立评分 — 评分用子agent,避免自己改自己评的偏差
  5. 人在回路 — 每个skill优化完后暂停,用户确认再继续

9维度评估体系(总分100)

基于微软SkillLens论文(arXiv 2605.23899)

| 维度 | 权重 | 评估内容 |

|:----|:----:|:---------|

| ① 结构完整性 | 15% | YAML frontmatter完整性、章节划分合理 |

| ② 清晰度 | 15% | 语言简洁、目标明确、无歧义 |

| ③ 内容完整性 | 15% | 覆盖主题关键方面,无重大遗漏 |

| ④ 可操作性 | 15% | 步骤具体、命令可执行、路径可查 |

| ⑤ 准确性 | 10% | 事实正确、引用准确、无幻觉 |

| ⑥ 一致性 | 10% | 内部逻辑自洽、术语统一 |

| ⑦ 执行效率 | 8% | 无冗余步骤、工具使用得当 |

| ⑧ 鲁棒性 | 7% | 有错误处理、备用方案、边界说明 |

| ⑨ 元技能合规 | 5% | 不违反元技能黑名单 |

优化流程

  1. 评分 — 子agent独立9维评分
  2. 改进 — 根据低分项针对性优化
  3. 测试 — 跑test-prompts验证效果
  4. 验证 — 独立judge agent盲评
  5. 棘轮 — 只保留改进,自动回滚退步
  6. 确认 — 人在回路,确认后定稿
  7. 成果 — 生成结果卡片(HTML)

使用方式

调用达尔文对已有skill进行优化评估

关联Skill

  • nuwa-skill(女娲·造人)→ 创建Skill
  • darwin-skill(达尔文·进化)→ 优化Skill ✅ 当前
  • skill-orchestrator(技能总指挥)→ 调度管理

GitHub 发布

本Skill已发布在公司GitHub仓库:

https://github.com/dxy0905/qiushuzhifang-skills/tree/main/skills/darwin-skill

版本历史

共 1 个版本

  • v2.0.0 当前
    2026-06-07 06:42

安全检测

腾讯云安全 (Keen)

队列中

腾讯云安全 (Sanbu)

队列中

🔗 相关推荐

ai-intelligence

self-improving agent

pskoett
捕获经验教训、错误和纠正,以实现持续改进。使用时机:(1)命令或操作意外失败;(2)用户纠正……
★ 4,061 📥 799,434
security-compliance

Skill Vetter

spclaudehome
AI智能体技能安全预审工具。安装ClawdHub、GitHub等来源技能前,检查风险信号、权限范围及可疑模式。
★ 1,219 📥 266,796
developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 672 📥 324,466