AI 作为规划层和验收层,通过迭代循环生产新的 Skill。支持可插拔的外部 AI 作为执行层,也可以由 AI 自身完成全部流程。
用户说以下任一内容时启动本 skill:
Skill Factory 是一个 meta-skill——造 skill 的 skill。
核心能力:
角色分工:
tech-library.md 模板)
call-guide.md 模板)
在进入正式流程前,先判断请求类型:
迭代模式特殊规则:
向用户确认迭代模式:
| 档位 | 人机比例 | 适用场景 |
|------|---------|---------|
| 手动档 | 用户100% | 用户只需要初版,自己改 |
| 半自动档 | 用户在关键节点介入 | 需要用户判断质量方向 |
| 全自动档 | 用户提供参考,AI 自动迭代 | 有明确对标成品 |
全自动档额外参数:
[潜在子skill],但不拆分
设计文档格式:
## Skill 设计:<skill名称>
### 步骤拆解
1. <步骤名> → 执行AI: <AI名称> → [潜在子skill](如适用)
2. <步骤名> → 执行AI: <AI名称>
### 输出格式
<预期的 Skill 结构大纲>
### 参考来源
- 骨架参考:<已有skill名称>
- 对标成品:<成品描述>
生成规则:
手动档:生成后直接交付用户,流程结束(跳到第九步)。
用真实输入运行刚生成的 skill,验证是否可用。
测试方式:
测试输出:
## 测试报告 - 第N轮
### 执行摘要
- 测试输入:<描述>
- 总步骤数:X
- 成功步骤:Y
- 失败步骤:Z
### 逐步结果
| 步骤 | 状态 | 执行AI | 输出摘要 | 问题 |
|------|------|--------|---------|------|
### 最终输出
<skill 产出的完整结果>
将测试输出与参考成品进行对比,产出明确的质量判定。
评分维度(每项 0-10 分):
| 维度 | 说明 |
|------|------|
| 结构完整度 | 是否包含所有必要部分 |
| 内容深度 | 内容是否足够详细和专业 |
| 风格匹配度 | 语气、表达方式是否与参考一致 |
| 可执行性 | 步骤是否清晰到可以直接执行 |
| 输出质量 | 最终产出是否达到参考水准 |
质量判定(Quality Gate):
对比报告格式:
## 对比报告 - 第N轮
### 质量判定:PASS / CONCERNS / FAIL
### 评分
| 维度 | 分数 | 上轮 | 变化 |
|------|------|------|------|
| 结构完整度 | X/10 | Y/10 | +Z |
| 内容深度 | X/10 | Y/10 | +Z |
| 风格匹配度 | X/10 | Y/10 | +Z |
| 可执行性 | X/10 | Y/10 | +Z |
| 输出质量 | X/10 | Y/10 | +Z |
| **总分** | **XX/50** | **YY/50** | **+ZZ** |
### 差距分析
1. <具体问题>
### 修改建议(仅 CONCERNS/FAIL 时生成)
1. <具体修改建议>
根据对比报告的修改建议,修改 Skill 内容。
迭代规则:
退出条件(满足任一即退出):
每轮迭代记录:
### 迭代记录 - 第N轮
- 修改项:<改了什么>
- 测试结果:<通过/失败>
- 总分变化:XX → YY
- 状态:继续迭代 / 收敛退出 / 达标退出 / 到限退出
## Skill Factory 交付报告
### 基本信息
- Skill 名称:<name>
- 迭代轮次:N 轮
- 最终评分:XX/50
- 退出原因:收敛 / 达标 / 到限 / 手动
### 迭代历程
| 轮次 | 总分 | 主要修改 |
|------|------|---------|
### 子 Skill 潜力标记
- [潜在子skill] <步骤名>:<独立的理由>
### 后续建议
- <建议1>
- <建议2>
第一步 → 第二步 → 第三步 → 第四步 → 第五步 → 第九步(直接交付)
第一步 → 第二步 → 第三步 → 第四步 → 第五步
→ 第六步 → 第七步 → [用户确认] → 第八步 → 回到第六步
→ ... → 用户满意 → 第九步
第一步 → 第二步 → 第三步 → 第四步 → 第五步
→ 第六步 → 第七步 → 第八步 → 回到第六步
→ ... → 满足退出条件 → 第九步
根据场景-AI 对照表(call-guide.md)判断:
| 规则 | 说明 |
|------|------|
| 失败判定 | 同一 AI 连续失败 2 次才触发降级 |
| 失败类型 | HTTP 错误、超时、空响应、解析失败 |
| 记录日志 | 每次降级记录:日期、AI、失败原因、降级到谁 |
| 下次重试 | 降级不是永久的——下一个新任务仍先尝试主用 AI |
所有第三方 API 统一使用 OpenAI 兼容格式调用。具体的 API 配置参见 tech-library.md,调用模板参见 call-guide.md。
| 维度 | 权重 | 评分标准 |
|------|------|---------|
| 结构完整度 | 20% | 是否包含所有必要章节和步骤 |
| 内容深度 | 25% | 知识密度、专业性、细节程度 |
| 风格匹配度 | 15% | 与参考成品的语气、表达一致性 |
| 可执行性 | 25% | 步骤能否直接执行、是否有歧义 |
| 输出质量 | 15% | 最终产出的整体质量感受 |
标记条件(满足 2 条以上):
触发时机:主 skill 基础功能稳定后,用户主动提出。
分裂流程:
用户:帮我做一个"会议纪要"skill
小龙虾:好的,我来帮你创建一个会议纪要 skill。先确认几个问题:
用户:就是整理群里的讨论,输出待办和结论就行,半自动档
小龙虾:明白了。我来复述确认:……(进入完整流程)
当没有合适的现有 skill 作为参考时,使用此骨架:
---
name: <skill-name>
description: "<一句话描述>"
---
# <Skill 名称>
<一句话概述>
## 触发词
用户说以下任一内容时启动本 skill:
- "<触发词1>"
- "<触发词2>"
## 使用方式
- 直接说"<触发词>",我会引导你完成
- 或者说"<触发词> + 具体内容"直接执行
## 执行流程
1. **<步骤名>**
- <步骤内容>
2. **<步骤名>**
- <步骤内容>
## 核心规则
1. <规则1>
2. <规则2>
## 与其他 Skill 的配合
- **<skill名>**:<配合方式>
skill-factory 运行时维护以下上下文变量:
| 变量 | 设定时机 | 用途 |
|------|---------|------|
| target_skill_name | 第一步 | 目标 skill 名称 |
| mode | 第二步 | 手动/半自动/全自动 |
| max_iterations | 第二步 | 全自动档循环上限 |
| reference_skill | 第三步 | 骨架参考 skill |
| benchmark_material | 第三步 | 对标成品 |
| current_iteration | 第六步起 | 当前迭代轮次 |
| scores_history | 第七步起 | 历次评分记录 |
共 1 个版本