Auto Improvement Orchestrator Skill

Skill 自动评估和改进管线。9 维结构评分（含 LLM-as-Judge）、4 角色加权、类别修正系数（tool/knowledge/orchestration/rule）、Pareto front 回归保护（security 2%/efficiency 10%/其他 5%）、trace-aware 失败...

未分类 clawhub v1.0.3 1 版本 100000 Key: 无需

★ 0

Stars

📥 385

下载

💾 1

安装

版本

#latest

概述

Auto-Improvement Orchestrator

从评估到改进到验证的完整管线，让 Skill 自动变好。

When to Use

评估一个 skill 的质量（9 维打分 + 4 角色评审）
自动改进 SKILL.md（生成候选→打分→执行→门禁）
批量改进多个 skill（autoloop 连续运行）
从 Claude Code 会话日志提取用户反馈信号
对比 skill 改进前后的 Pareto front

When NOT to Use

手动编辑单个 SKILL.md → 直接改文件
Agent 执行可靠性 → 用 execution-harness（独立仓库）
纯文档生成 → 用 doc-gen
Prompt 优化（token 级）→ 用 DSPy

Quick Start

# 打分
python3 skills/improvement-learner/scripts/self_improve.py \
  --skill-path /your/skill --max-iterations 1

# 自动改进 5 轮
python3 skills/improvement-learner/scripts/self_improve.py \
  --skill-path /your/skill --max-iterations 5

# 从会话日志提取反馈
python3 skills/session-feedback-analyzer/scripts/analyze.py \
  --output feedback.jsonl

Architecture

11 个管线 skill 分三层：

评估层: learner（9 维结构评分）、evaluator（执行测试）、session-feedback（用户反馈）
改进层: generator → discriminator → evaluator → executor → gate（6 层门禁）
控制层: autoloop（连续运行）、benchmark-store（Pareto front）、execution-harness（独立仓库）

辅助工具: skill-forge（造 skill）、skill-distill（合并 skill）

验证目标: prompt-hardening、deslop

execution-harness — Agent 执行可靠性（38 patterns × 6 axes）

版本历史

共 1 个版本

v1.0.3 当前

2026-05-07 07:20 安全安全

安全检测

腾讯云安全 (Keen)

安全，无风险

查看报告

腾讯云安全 (Sanbu)

安全，无风险

查看报告

🔗 相关推荐

content-creation

去 AI 味内容引擎

lanyasheng

为小红书、X、知乎等平台生成“去 AI 味”的内容重写与新稿产出技能。用于用户要求内容更像真人表达、减少模板腔、提升口语感和观点力度的场景；也用于把已有草稿改写为平台适配版本。触发词包括“去 AI 味”“重写成更像人写的”“太像 AI 了”

★ 15 📥 4,763

ai-agent

self-improving agent

pskoett

捕获经验教训、错误及修正内容，以实现持续改进。适用于以下场景：（1）命令或操作意外失败；（2）用户纠正Claude（如“不，那不对……”“实际上……”）；（3）用户请求的功能不存在；（4）外部API或工具出现故障；（5）Claude发现自身

★ 4,114 📥 835,556