← 返回
未分类

Auto Improvement Orchestrator Skill

Skill 自动评估和改进管线。9 维结构评分(含 LLM-as-Judge)、4 角色加权、 类别修正系数(tool/knowledge/orchestration/rule)、Pareto front 回归保护 (security 2%/efficiency 10%/其他 5%)、trace-aware 失败...
Skill 自动评估和改进管线。9 维结构评分(含 LLM-as-Judge)、4 角色加权、 类别修正系数(tool/knowledge/orchestration/rule)、Pareto front 回归保护 (security 2%/efficiency 10%/其他 5%)、trace-aware 失败...
lanyasheng lanyasheng 来源
未分类 clawhub v1.0.3 1 版本 100000 Key: 无需
★ 0
Stars
📥 385
下载
💾 1
安装
1
版本
#latest

概述

Auto-Improvement Orchestrator

从评估到改进到验证的完整管线,让 Skill 自动变好。

When to Use

  • 评估一个 skill 的质量(9 维打分 + 4 角色评审)
  • 自动改进 SKILL.md(生成候选→打分→执行→门禁)
  • 批量改进多个 skill(autoloop 连续运行)
  • 从 Claude Code 会话日志提取用户反馈信号
  • 对比 skill 改进前后的 Pareto front

When NOT to Use

  • 手动编辑单个 SKILL.md → 直接改文件
  • Agent 执行可靠性 → 用 execution-harness(独立仓库)
  • 纯文档生成 → 用 doc-gen
  • Prompt 优化(token 级)→ 用 DSPy

Quick Start

# 打分
python3 skills/improvement-learner/scripts/self_improve.py \
  --skill-path /your/skill --max-iterations 1

# 自动改进 5 轮
python3 skills/improvement-learner/scripts/self_improve.py \
  --skill-path /your/skill --max-iterations 5

# 从会话日志提取反馈
python3 skills/session-feedback-analyzer/scripts/analyze.py \
  --output feedback.jsonl

Architecture

11 个管线 skill 分三层:

  • 评估层: learner(9 维结构评分)、evaluator(执行测试)、session-feedback(用户反馈)
  • 改进层: generator → discriminator → evaluator → executor → gate(6 层门禁)
  • 控制层: autoloop(连续运行)、benchmark-store(Pareto front)、execution-harness(独立仓库)

辅助工具: skill-forge(造 skill)、skill-distill(合并 skill)

验证目标: prompt-hardening、deslop

Related

版本历史

共 1 个版本

  • v1.0.3 当前
    2026-05-07 07:20 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

content-creation

去 AI 味内容引擎

lanyasheng
为小红书、X、知乎等平台生成“去 AI 味”的内容重写与新稿产出技能。用于用户要求内容更像真人表达、减少模板腔、提升口语感和观点力度的场景;也用于把已有草稿改写为平台适配版本。触发词包括“去 AI 味”“重写成更像人写的”“太像 AI 了”
★ 15 📥 4,763
ai-agent

self-improving agent

pskoett
捕获经验教训、错误及修正内容,以实现持续改进。适用于以下场景:(1)命令或操作意外失败;(2)用户纠正Claude(如“不,那不对……”“实际上……”);(3)用户请求的功能不存在;(4)外部API或工具出现故障;(5)Claude发现自身
★ 4,114 📥 835,556
ai-agent

Find Skills

guipi888
场景驱动+关键词双模式技能发现工具。当用户用自然语言描述场景/需求(如"我想做一个海报""帮我分析股票"),或明确说"安装技能/find skills/找个skill"时,自动从官方内置、本地已安装、SkillHub、虾评、GitHub、C
★ 1,480 📥 542,872