概述

Auto-Coding v3.7.17-compliance

概述 / Overview

Auto-Coding 是一个智能自主编码系统，通过全子代理架构 + 分阶段技能注入，完成从需求到代码的完整开发流程。

Auto-Coding is an intelligent autonomous coding system that completes the full development lifecycle from requirements to code through a fully sub-agent architecture with staged skill injection.

本质: 单进程串行 + 多角色 Prompt + 多模型切换。每一步换不同的人格和模型来审视代码，不是真正的多 Agent 并行。

Essence: Single-process serial execution + multi-role prompting + multi-model switching. Each step uses a different persona and model to review the code — not true multi-agent parallelism.

核心特性:

全子代理架构 — 主会话只做监工，所有干活用子代理执行
分阶段技能注入 — 每阶段注入对应技能文件，≤2 技能/阶段
8 步循环 — 设计→分解→编码→测试→反思→优化→验证→输出
Reviewer 否决权 — 审查发现 🔴 阻塞项触发重写，最多 3 次迭代
复杂度自动分级 — A (Micro) / B (Feature) / C (System)，自动跳过不需要的阶段
Risk Scorecard — 五元组量化检测，公用信号识别
状态持久化 — .auto-coding/state.json，仅保存任务恢复所需摘要，session 断了可恢复
审批策略 — .auto-coding/rules.yaml，默认收窄自动批准范围，敏感操作必须确认
进度汇报 — 默认前台逐阶段输出；可选开启通知或调度检查，默认不创建后台 cron

Key features:

Full sub-agent architecture — main session only supervises; all work delegated to sub-agents
Staged skill injection — each phase injects corresponding skill files, ≤2 skills per phase
8-step cycle — Design → Decompose → Code → Test → Reflect → Optimize → Verify → Output
Reviewer veto power — 🔴 blockers trigger rewrite, up to 3 iterations
Auto complexity grading — A (Micro) / B (Feature) / C (System), auto-skip irrelevant phases
Risk Scorecard — 5-tuple quantified detection with public signal recognition
State persistence — .auto-coding/state.json, stores resumable task summaries only
Approval rules — .auto-coding/rules.yaml, narrow default auto-approval and require confirmation for sensitive actions
Progress reporting — foreground per-phase output by default; optional notification/scheduler check only when explicitly enabled

设计哲学 / Design Philosophy

思考优先 — 不假设，模糊需求列出假设或直接提问
极简主义 — 最少代码解决问题，自检"200 行能否缩到 50 行"
手术刀修改 — 只改必须改的，不顺手重构，遵循现有风格
目标导向 — 先定义 Done 标准再编码，验证通过才算完成

Think first — Don't assume; list assumptions for ambiguous requirements or ask directly
Minimalism — Solve with minimal code; self-check "can 200 lines shrink to 50?"
Scalpel edits — Only change what's necessary; don't refactor opportunistically; follow existing style
Goal-oriented — Define Done criteria before coding; verification pass = completion

🔴 执行铁律

铁律 1: 自动推进，不中途停下

启动后连续完成所有阶段。只在 3 种情况打断: (1) 需求不明确 (2) 多方案需选择 (3) 安全审批。

铁律 2: 全子代理化，主会话只做监工

所有干活用子代理执行。主会话职责: 分阶段派活、检查文件质量、打回重写、交付结果。

铁律 3: 每步输出，不攒到最后

每阶段完成后立刻在当前会话输出结果（当前阶段、模型、做了什么、发现了什么），然后直接进入下一阶段。这是默认进度汇报机制，避免依赖后台 cron 或外部通知。

📋 8 步循环流程 + 技能注入

设计 → 分解 → 编码 → 测试 → 反思 → 优化 → 验证 → 输出
  ↑_______________________________________↓
              迭代 (最多 3 次)

步骤	阶段	注入技能	模型	职责
------	------	---------	------	------
1	设计	`grill-with-docs`	`deepseek-v4-pro`	需求对齐、技术方案
2	分解	`decomposition`	`deepseek-v4-pro`	任务拆解、依赖分析
3	编码	`tdd`	`deepseek-v4-pro`	TDD 红-绿-重构
4	测试	`testing`	`deepseek-v4-pro`	边界覆盖、回归检测
5	反思	`zoom-out` + `code-review`	`deepseek-v4-pro`	审查、🔴🟡💭 分级
6	优化	`optimize`	`deepseek-v4-pro`	推理重构
7	验证	`verification`	`deepseek-v4-pro`	交付验证
8	输出	—	—	交付物

> 注入规则: 每阶段 ≤2 技能文件，全局文件（risk-scorecard + discipline-meta）随首次注入附带。注入失败不阻塞流程。

>

> Reviewer 否决权: 审查发现 🔴 阻塞项（安全漏洞、不符合需求、过度设计）→ 触发重写，最多 3 次迭代。

> 详细见: skills/code-review.skill.md

>

> 调试子流程: 测试失败或否决时触发 6 阶段调试（反馈循环→复现→假设→插桩→修复→清理）。

> 详细见: skills/diagnose.skill.md

>

> 模型适配: 各阶段模型应根据自身模型配置进行重新适配，推荐采用多模型交叉检测与验证的方式，避免单一模型盲区。

>

> Model adaptation: Each phase's model should be re-adapted based on available model configuration. Multi-model cross-validation is recommended over single-model detection to avoid blind spots.

⚡ 复杂度自动分级

等级	特征	阶段数	典型耗时
------	------	--------	---------
A (Micro)	单函数、Bug 修复	编码→测试→验证 (3)	<2 分钟
B (Feature)	模块开发、单 API	设计→编码→测试→验证 (4)	2-5 分钟
C (System)	完整系统、多文件重构	设计→分解→编码→测试→反思→优化→验证 (7)	5-15 分钟

> A 级至少注入 grill-with-docs（需求确认部分）。连续 2 次阻塞自动升级为 B 级。

🤖 模型分配 + 降级

阶段	首选	Fallback 1	Fallback 2
------	------	-----------	-----------
设计/分解	`deepseek-v4-pro`	`MiMo v2.5 Pro`	—
编码/测试	`deepseek-v4-pro`	`MiMo v2.5 Pro`	—
审查/优化	`deepseek-v4-pro`	`MiMo v2.5 Pro`	—
验证	`deepseek-v4-pro`	`MiMo v2.5 Pro`	—

降级原则: 优先同级别 → 降一级 → 记入日志。

📝 子代理铁律

所有子代理禁止输出完整内容到对话:

✅ {阶段}完成
📄 输出文件: {file1}, {file2}, ...
💡 一句话结论: {核心结论}

🧠 编码纪律（精简）

思考优先: 不假设，模糊需求列出假设或直接提问
极简主义: 最少代码解决问题，自检"200 行能否缩到 50 行"
手术刀修改: 只改必须改的，不顺手重构，遵循现有风格
目标导向: 先定义 Done 标准再编码，验证通过才算完成

📁 技能文件索引

技能文件	注入阶段	职责
---------	---------	------
`skills/grill-with-docs.skill.md`	Step 1 设计	需求对齐、结构化追问、CONTEXT.md 维护
`skills/decomposition.skill.md`	Step 2 分解	任务拆解纪律、依赖分析、粒度检查
`skills/tdd.skill.md`	Step 3 编码	TDD 红-绿-重构循环、垂直切片规则
`skills/testing.skill.md`	Step 4 测试	测试策略、边界覆盖、回归检测
`skills/zoom-out.skill.md`	Step 5 反思	全局视角、跨模块依赖分析
`skills/code-review.skill.md`	Step 5 反思	Reviewer 审查、🔴🟡💭 分级、Reviewer 否决权
`skills/optimize.skill.md`	Step 6 优化	重构纪律、性能优化检查清单
`skills/verification.skill.md`	Step 7 验证	交付验证清单、阶段聚合
`skills/diagnose.skill.md`	调试子流程	6 阶段系统化调试
`skills/improve-architecture.skill.md`	Step 8.5	架构健康检查、深层耦合发现
`skills/risk-scorecard.skill.md`	全局（首次附带）	Risk Scorecard 五元组、公用信号检测规则
`skills/discipline-meta.skill.md`	全局（首次附带）	元规则、量化上限、override 流程

⚠️ 安全透明声明

进度汇报策略

默认情况下，Auto-Coding 不创建后台 cron，也不主动发送飞书消息。进度通过当前会话逐阶段输出：每完成一个阶段立即报告阶段名、产物、发现的问题和下一步。

如用户明确要求“后台跑完通知我 / 开启进度检查”，才启用可选通知机制：

模式	默认状态	数据流向	说明
------	---------	---------	------
前台逐阶段输出	✅ 默认开启	当前会话	每阶段完成后直接汇报，不产生后台任务
终态通知	❌ 默认关闭	用户指定通知通道	仅发送任务标题、任务 ID、阶段摘要和完成状态
调度检查	❌ 默认关闭	宿主调度器	仅在用户显式 opt-in 时创建；任务结束后自动删除，并提供手动清理指引

外部操作

操作	默认状态	数据流向	说明
------	---------	---------	------
模型推理	按宿主配置	任务描述 / 必要代码上下文 → 宿主模型服务	不读取或发送 API 密钥；具体模型网络路径由宿主环境决定
外部通知	默认关闭	阶段摘要 / 完成状态 → 用户指定通道	仅在用户显式开启时使用
环境配置	可选	本地配置 → 模型选择	仅读取非密钥模型选择项；不读取 `apiKey`、`baseUrl`、token 等敏感字段

文件系统

操作	范围	说明
------	------	------
读取	当前项目目录	读取需求相关代码、测试、配置和依赖文件
写入代码	当前项目目录	仅修改任务相关文件；敏感路径需审批
状态目录	`.auto-coding/`	保存 `state.json`、阶段摘要日志、审批状态和 scratchpad，用于恢复与审计

.auto-coding/ 可能包含任务描述、文件路径、阶段摘要、测试结果和局部代码片段。建议将其加入 .gitignore，避免误提交；任务完成后可删除该目录清理本地状态。

模型环境变量

AUTO_CODING_MODEL_DESIGN=...     # 设计阶段模型覆盖
AUTO_CODING_MODEL_DECOMPOSE=...  # 分解阶段模型覆盖
AUTO_CODING_MODEL_CODE=...       # 编码阶段模型覆盖
AUTO_CODING_MODEL_TEST=...       # 测试阶段模型覆盖
AUTO_CODING_MODEL_REVIEW=...     # 审查阶段模型覆盖
AUTO_CODING_MODEL_OPTIMIZE=...   # 优化阶段模型覆盖
AUTO_CODING_MODEL_VERIFY=...     # 验证阶段模型覆盖
AUTO_CODING_FALLBACK_MODEL_1=... # 回退模型 1
AUTO_CODING_FALLBACK_MODEL_2=... # 回退模型 2

> 所有环境变量均为可选，只用于模型选择或降级策略，不应包含 API 密钥、Base URL、token 或其它敏感配置。

📦 使用示例

A 级: auto-coding：写一个 Python 函数计算两个列表的交集 → 编码→测试→验证
B 级: Auto coding：实现一个 REST API，支持用户注册和登录 → 设计→编码→测试→验证
C 级: 启动自动编码：从零搭建一个博客系统，支持文章发布和评论 → 完整 7 阶段

⚙️ 项目配置

状态持久化: .auto-coding/state.json — session 中断自动从上次阶段恢复
审批策略: .auto-coding/rules.yaml — 默认仅自动批准文档类低风险修改；代码修改、命令执行和敏感路径默认要求确认
阶段日志: .auto-coding/logs/{order}-{phase}.log — 每个阶段独立可追溯，建议不提交到版本库

v3.7.17-compliance · 2026-06-09

版本历史

共 2 个版本

v3.7.17 当前

2026-06-11 16:48
v3.7.15

2026-05-26 22:43 安全安全

安全检测

腾讯云安全 (Keen)

队列中

腾讯云安全 (Sanbu)

队列中

Auto Coding V3

概述