无根因调查则无修复。
修复症状会产生打地鼠式 debug。每个不解决根本原因的修复都会让下一个 bug 更难找到。找到根因,然后修复它。
在形成任何假设之前收集上下文。
```bash
git log --oneline -20 -- <受影响的文件>
```
这之前能工作吗?什么改变了?回归意味着根因在 diff 中。
输出:"根因假设:..." — 关于什么出错以及为什么的具体、可测试的声明。
检查这个 bug 是否匹配已知模式:
| 模式 | 特征 | 查看位置 |
|---|---|---|
| ----- | ----- | --------- |
| 竞态条件 | 间歇性、时间依赖 | 对共享状态的并发访问 |
| Nil/null 传播 | NoMethodError, TypeError | 可选值上的缺失守卫 |
| 状态损坏 | 数据不一致、部分更新 | 事务、回调、钩子 |
| 集成失败 | 超时、意外响应 | 外部 API 调用、服务边界 |
| 配置漂移 | 本地工作,staging/prod 失败 | 环境变量、特性开关、数据库状态 |
| 陈旧缓存 | 显示旧数据,清除缓存后修复 | Redis、CDN、浏览器缓存 |
还要检查:
TODOS.md 中相关的已知问题git log 中同一区域的先前修复 — 同一文件中的重复 bug 是架构气味,不是巧合在写任何修复之前,验证你的假设。
```
已测试 3 个假设,都不匹配。这可能是架构问题而不是简单的 bug。
A) 继续调查 — 我有新假设:[描述]
B) 升级给人审查 — 这需要了解系统的人
C) 添加日志等待 — 标记区域,下次捕获它
```
红旗 — 如果看到这些,放慢速度:
一旦根因确认:
```
此修复涉及 N 个文件。对于 bug 修复来说影响范围很大。
A) 继续 — 根因确实跨越这些文件
B) 拆分 — 现在修复关键路径,延迟其余
C) 重新思考 — 也许有更有针对性的方法
```
全新验证: 复现原始 bug 场景并确认它已修复。这不是可选的。
运行测试套件并粘贴输出。
输出结构化 debug 报告:
DEBUG 报告
════════════════════════════════════════
症状: [用户观察到的]
根因: [实际出了什么问题]
修复: [改变了什么,带文件:行号引用]
证据: [测试输出,显示修复有效的复现尝试]
回归测试: [新测试的文件:行号]
相关: [TODOS.md 项目、同一区域的先前 bug、架构笔记]
状态: DONE | DONE_WITH_CONCERNS | BLOCKED
════════════════════════════════════════
共 1 个版本