← 返回
未分类

Agent Skills技能演化专家版本(也许是地表最强)

技能优化专家 - 渐进式路由驱动的智能技能优化器。 触发场景:优化/改进/重构/审核/诊断/调优/标准化/升级 skill 或 SKILL.md 核心能力:三级路由 + 8维度评估 + 21项诊断检查 + 四类验证测试 + 5大设计模式 + 棘轮容差 + 反模式检测 + 版本管理
技能优化专家 - 渐进式路由驱动的智能技能优化器。 触发场景:优化/改进/重构/审核/诊断/调优/标准化/升级 skill 或 SKILL.md 核心能力:三级路由 + 8维度评估 + 21项诊断检查 + 四类验证测试 + 5大设计模式 + 棘轮容差 + 反模式检测 + 版本管理
star.qin
未分类 community v1.8.0 4 版本 100000 Key: 无需
★ 0
Stars
📥 79
下载
💾 0
安装
4
版本
#latest

概述

Skills Optimization Pro

> 评估驱动 · 模式指导 · 棘轮保障 · 渐进路由

核心循环:诊断→路由→优化→验证→记录


🚀 快速导航

场景入口流程
------------------
格式修复L1 Quick Fix检测→修复→结束
单技能优化L2Phase 1→2→3
全量评估L3 Phase 1诊断→评分→报告
批量优化L3Phase 0→1→2→3→4
查看历史读 results.tsv + CHANGELOG直接输出

路由决策矩阵

输入信号路由级别量化阈值执行路径预算
------------------------------------------
frontmatter/格式问题L1 Quick FixYAML错误 / 缺name / 缺version / 触发词<3 / tags<2 / 缺序号检测→修复→确认→结束5K
指定单个skill优化L2 单技能1个skill名 + 评分<60→强制重组 / ≥60→精练优化Phase 1→2→320K
批量/全量优化、评估L3 全量2+个skill 或 "所有"/"批量"关键词Phase 0→1→2→3→450K

路由规则:从L1开始检测,命中即执行并终止;未命中则降级到下一级。L2内部由Phase 1评分决定子路径。全局约束:max_skills=10, max_rounds=3, max_tokens=100K。

→ 输出: 路由级别 + 执行计划


评估速查(8维度,100分)

维度权重一句话标准
-----------------------
Frontmatter8name规范、description含功能+触发词、≤1024字符
工作流清晰度15有序号、每步有输入/输出、Phase/Step结构
边界条件10有异常处理、fallback路径、错误恢复
检查点7关键决策前用户确认
指令具体性15有参数/格式/示例、可直接执行
资源整合度5引用路径正确可达
整体架构15层次清晰、无冗余遗漏、设计模式合理
实测表现25测试prompt输出符合skill宣称能力

评分:维度1-7各1-10分×权重;维度8跑2-3测试prompt打分×权重。详见 references/evaluation-rubric.md


反模式速查

ID反模式检测规则严重度
-----------------------------
AP-1God Skill>500行 或 3+不相关功能critical
AP-2Vague Instruction步骤含模糊动词无细化high
AP-3Missing Fallback无异常处理路径high
AP-4Trigger Blindtriggers<3medium
AP-5Checkpoint Absent无用户确认点high
AP-6Copy-Paste Driftdescription与工作流不匹配medium
AP-7Over-ConstrainedDO NOT>10条low
AP-8Zombie Reference引用路径不存在medium
AP-9Version Staleversion与CHANGELOG不一致low
AP-10Monologue Skill无交互点medium
AP-11Silent Failure有异常处理但无日志/通知/恢复动作high
AP-12Ghost Dependency引用未声明的工具或文件medium
AP-13Magic Number硬编码阈值无注释解释low

critical/high→Phase 2优先修复;结果记录到anti_patterns列。关键词自动检测规则见 references/evaluation-rubric.md


设计模式速查

技能类型推荐模式优化点
--------------------------
tool_callingTool Wrapper统一接口、错误重试、IO契约
content_genGenerator模板加载、变量收集、输出规范
reviewReviewerseverity分级、checklist、结构化报告
interactionInversion门控问题、偏好收集、交互决策点
pipelinePipeline阶段checkpoint、进度可视化
hybrid主+辅模式主功能选主模式,次功能选辅模式

详见 references/design-patterns.md

版本规则

类型变更判定条件
---------------------
Patch+0.0.1Quick Fix/格式修正;改动≤10行且无流程变更
Minor+0.1.0应用模式/新增检查点/补充边界;改动≤50行或+1模式
Major+1.0.0探索性重写/流程重组;改动>50行或涉及流程重组

执行流程

Phase 0: 初始化(L3专用)

步骤动作→ 输出
--------------------
0.1确认范围(全量扫描/用户列表)技能清单
0.2全量备份每个目标技能 → zip(除了_BAK或backup类似目录的其他含目标技能的 SKILL.md + references + changelogs + _meta.json),命名 {skill-name}-backup-YYYYMMDD.zip,存储到目标技能根目录_BAK下备份路径列表
0.3创建分支 skills-optimization-pro/YYYYMMDD-HHMM分支名
0.4初始化 results.tsv历史记录

强制规则每次优化其他技能前必须先备份目标技能目录。无备份不启动优化流程。备份文件作为回滚基准点。

Phase 1: 诊断评估

步骤动作→ 输出
--------------------
1.0分类→推荐模式skill_type
1.1生成测试prompt(Happy/Ambiguous/Edge)test-prompts.json
1.2基线评估(维度1-7打分+理由;维度8子agent或dry_run)评分卡
1.3反模式扫描 AP-1~AP-13(含关键词自动检测)anti_patterns
1.4优秀点+待优化清单+收益预估对比分析
1.5快速诊断扫描(评分<60时触发21项检查)诊断报告
汇总展示评分卡+对比分析→用户确认→评分子路由→进入Phase2确认

快速诊断扫描(评分<60触发):执行21项诊断检查(详见 references/diagnostic-checklist.md)

类别检查项严重度
----------------------
Metadata (M1-M6)name格式、description格式("Use when")、关键词覆盖、第三人称HIGH
Architecture (A1-A5)文件≤500行、渐进披露、引用深度≤1级、工作流清晰MEDIUM
Text (T1-T5)Token合理化、假设Claude已掌握基础、术语一致、具体示例MEDIUM
Code (C1-C5)错误处理、魔术数需注释、依赖声明、Unix路径、验证步骤HIGH

输出:按优先级分组的问题清单(HIGH→MEDIUM→LOW),每项含当前状态+修复建议+影响说明

评分子路由(L2内部):评分<60→强制结构重组路径(优先修复critical/high AP);评分≥60→精练优化路径(按最低维度迭代)。

收益对比规则:量化收益(分数提升)+ 质化收益(反模式消除/体验改善)+ 风险评估。

Phase 2: 优化执行

按基线分数从低到高,每个skill最多3轮:

步骤动作→ 输出
--------------------
2.1找最低维度目标维度
2.2选设计模式模式选择
2.3头脑风暴策略(见下方)→生成3方案→用户选择改进方案
2.4编辑SKILL.md + git commitcommit hash
2.5重新评估新评分
2.6棘轮决策(差值>+2或P0/P1改善→keep,否则→revert)decision_reason
2.7记录 results.tsv日志行

头脑风暴优先策略

优先级策略执行方式
-----------------------
P0调用 01_ProductManager_BrainstormingSkill工具→互动探索→用户选择
P1联网搜索 + 推理WebSearch + 评估 + 反模式 → 3方案
P2纯推理设计模式库 + evaluation-rubric → 3方案

方案输出(P1/P2):3方案各含[改什么/为什么/收益/风险],推荐方案附理由。用户选择后进入 Step 2.4。

Phase 2.5 探索性重写(可选):连续2个skill break→提议重写→用户同意→stash→重写→评估→对比→采用或恢复。

Phase 3: 验证确认

步骤动作→ 输出
--------------------
3.1子agent最终评分(含四类验证测试)最终评分
3.2用户确认确认
3.3更新版本号 + changelog版本记录
3.4输出物校验(见下方)校验结果

四类验证测试(详见 references/verification-guide.md)

测试类型目标Pass CriteriaFail Criteria
--------------------------------------------
Trigger Test技能能否被正确发现和加载✅ Skill discovered from description❌ Skill not found / Wrong skill loaded
Understanding Test工作流能否被正确理解和执行✅ Workflow correctly identified❌ Steps out of order / Tools misunderstood
Execution Test能否完成实际任务(真实场景)✅ Expected output produced❌ Script errors / Unexpected output
Regression Test优化是否破坏已有功能✅ All scenarios work as before❌ New errors / Different output

测试prompt模板:每种测试类型都有标准prompt模板(见 references/verification-guide.md),包含:

  • Trigger Test:模拟用户自然语言请求,验证技能发现
  • Understanding Test:问答式验证工作流理解
  • Execution Test:真实任务执行验证
  • Regression Test:对比优化前后行为一致性

输出物校验清单

输出物必须/可选校验方式
--------------------------
优化后SKILL.md必须评分对比(新>旧)
评分卡(前后对比)必须8维度明细完整
CHANGELOG条目必须版本号递增
results.tsv记录必须字段完整
诊断报告L3必须/L2可选含评分+AP+建议
新增/修改references可选路径可达

Phase 4: 汇总报告

步骤动作→ 输出
--------------------
4.1展示优化数/实验次数/保留回滚比/分数变化/模式应用/版本变更报告
4.2跨技能挖掘(低分维度/常用模式/常见反模式/高成功率策略)全局建议
4.3更新知识库知识库更新

results.tsv

字段:timestamp | commit | skill | skill_type | old_score | new_score | status | dimension | note | eval_mode | design_pattern | decision_reason | anti_patterns

位置:.claude/skills/skills-optimization-pro-results.tsv


约束

ID规则
----------
1不改变核心功能,只优化"怎么写"和"怎么执行"
2不引入新依赖
3每轮只改一个维度(归因清晰)
4SKILL.md ≤ 原始150%
5git revert 回滚,禁止 reset --hard
6效果维度子agent或干跑验证(评分独立)
7每次优化记录 changelog

禁止:改变核心功能 | 添加未授权依赖 | 跳过用户确认 | 自己评自己 | 无测试保留改进 | 忽略 changelog


使用方式

模式触发语示例
-----------------
L1 Quick Fix"修复格式问题"
L2 单技能"优化 example-skill"
L2 应用模式"应用 Reviewer 模式"
L3 仅评估"评估所有skills质量"
L3 全量优化"优化所有skills"
L3 批量"批量优化5个技能"
查看历史"看看优化历史"

关联资源

  • references/evaluation-rubric.md — 评估标准 checklist + 反模式关键词检测
  • references/design-patterns.md — 设计模式决策树 + 应用案例
  • references/optimization-strategies.md — 优化策略 P0-P3
  • references/best-practices.md — 最佳实践规则清单
  • references/validation-cases.md — 验证案例量化数据
  • references/diagnostic-checklist.md — 21项诊断检查点(Metadata/Architecture/Text/Code)+ 示例 + 严重度定义
  • references/verification-guide.md — 四类验证测试(Trigger/Understanding/Execution/Regression)+ prompt模板
  • references/quality-standards.md — 质量标准定义 + A-F评分体系
  • references/report-templates.md — 诊断报告模板 + 结构化输出格式

版本历史

共 3 个版本

  • v1.8.0 ## v1.6.0 → v1.7.0 ### 新增内容 | 项目 | 变更 | | ---------------- | ----------------------------------------------------- | | **路由量化阈值** | 路由矩阵新增"量化阈值"列(YAML错误/缺name/评分<60等) | | **评分子路由** | L2内部:评分<60→强制重组路径;评分≥60→精练优化路径 | | **核心循环** | 新增"诊断→路由→优化→验证→记录"循环描述 | --- ## v1.7.0 → v1.8.0 ### 新增内容 | 项目 | 变更 | | ------------------ | ------------------------------------------------------------ | | **21项诊断检查** | 评分<60时触发,分4类(Metadata/Architecture/Text/Code) | | **四类验证测试** | Phase 3 新增 Trigger/Understanding/Execution/Regression 测试 | | **反模式新增** | AP-11 Silent Failure / AP-12 Ghost Dependency / AP-13 Magic Number | | **关键词自动检测** | 反模式扫描支持关键词自动检测(见 evaluation-rubric.md) | | **输出物校验** | Phase 3.4 新增校验清单(SKILL.md/评分卡/CHANGELOG/results.tsv/诊断报告) | | **测试prompt模板** | 每类验证测试有标准模板(见 verification-guide.md) | | **备份路径优化** | 备份存储到目标技能根目录 `_BAK` 下,排除已有备份目录 | | **核心能力更新** | description 新增 "21项诊断检查 + 四类验证测试" | --- ## 版本号规则 | 版本 | 变更类型 | 说明 | | ------ | -------- | ----------------------- | | v1.6.0 | Minor | 渐进式路由 + Token精练 | | v1.7.0 | Minor | 量化阈值 + 子路由 | | v1.8.0 | Minor | 诊断检查 + 验证测试体系 | --- ## 文件新增 | 文件 | 用途 | | ---------------------------------- | -------------------- | | references/diagnostic-checklist.md | 21项诊断检查详细规则 | | references/verification-guide.md | 四类验证测试模板 | --- _更新人: star.qin_ 当前
    2026-05-16 10:47 安全 安全
  • v1.6.0 # CHANGELOG v1.6.0 > 2026-05-16 ## 渐进式路由引导 + Token 精练优化 ### 核心修正 #### Phase 0.2 备份规则明确化 - **修正前**:备份描述模糊,可能被理解为备份本技能目录 - **修正后**:明确"备份每个目标技能目录"(被优化的技能) - 备份内容:目标技能的 SKILL.md + references + changelogs + _meta.json - 命名格式:`{skill-name}-backup-YYYYMMDD.zip` - 存储位置:目标技能根目录 - **强制规则**:每次优化其他技能前必须先备份目标技能,无备份不启动优化流程 ### 新增功能 #### 快速导航表格 - 新增「快速导航」入口(场景→入口→流程) - 用户可快速定位:格式修复(L1)、单技能优化(L2)、全量评估(L3)、批量优化(L3)、查看历史 ### Token 精练优化 | 精简项 | 原格式 | 新格式 | 节省 | |--------|--------|--------|------| | 方案输出格式 | 15行代码块 | inline简述 | ~200 tokens | | 收益对比规则 | 3条列表 | 1条inline | ~50 tokens | | Phase 0 步骤表 | 4行详细描述 | 4行精简 | ~30 tokens | | Phase 1 步骤表 | 6行详细描述 | 6行精简 | ~40 tokens | | Phase 2 步骤表 | 11行详细描述 | 11行精简 | ~60 tokens | | 约束规则 | 7条列表 | 表格格式 | ~20 tokens | | 使用方式 | 7行含路由 | 7行精简 | ~10 tokens | ### 行数变化 - 原始:255行 → 优化后:≈210行(缩减 18%) - Tokens 预估节省:≈400 tokens ### 结构优化 - Phase 步骤表同类项合并,动作描述精简 - 输出契约 `→ 输出` 保持一致 - 约束规则改为表格格式,更易扫描 ### 版本变更 - version: 1.5.0 → 1.6.0 - 变更类型:Minor(精简优化,无功能变更) ### 预期效果 - LLM 解析效率:快速导航直达入口,减少决策开销 - Token 消耗:精简约 18%,降低 API 成本 - 用户体验:场景导向导航,快速定位所需流程 --- _更新人: star.qin_
    2026-05-16 02:54 安全 安全
  • v1.4.1 v1.4.0 三级渐进路由、决策表替代伪代码、内联输出契约 路由驱动,大幅缩减 Token 消耗 v1.3.0 文档大幅精简,新增预算机制与版本升降规则 架构轻量化,管控成本与版本 v1.2.0 技能分类、动态测试 Prompt、跨技能模式挖掘 精准分类,实现知识复用 v1.1.0 快速修复通道、反模式检测、三级容差决策 快速排错,规避错误回滚 v1.0.0 融合双内核,搭建评估、设计模式、棘轮与版本体系 搭建整体基础核心框架
    2026-05-16 01:29 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

API测试自动化专家版

user_b91ca78d
API接口测试全能自动化专家。支持REST/GraphQL功能测试、Spring Doc/OpenAPI解析、 YAML测试定义、性能测试、契约测试、测试点分析、180陷阱知识库。 TRIGGER: 测试API/接口测试/测登录/测注册/测
★ 0 📥 103

大模型中文最强搜索引擎150+

user_b91ca78d
★ 1 📥 155

中国PM项目管理一站式全技能

user_b91ca78d
Use when managing IT service projects or brand PM work in China. Covers full PM lifecycle: planning, discovery, strategy
★ 0 📥 135