Code Organizer - 代码整理与项目重构技能

概述

本技能用于对 Python 项目进行系统性整理和重构（默认通用风格，根据具体项目类型自动适配）重要原则：始终先生成整理建议，等待用户批准后再执行任何文件修改

⚠️ 避免过度工程化 - 核心约束

整理/重构到最佳实践。所有优化措施均由用户主动选择，绝不默认执行

🔄 两轮确认流程（必须严格执行）

每次执行整理任务前，必须经过两轮用户确认，不可跳过：

第一轮：策略选择

扫描项目，评估规模（文件数、模块数、项目类型）

根据评估结果，向用户展示

可选策略列表

并给出推荐：

| 策略级别 | 适用场景 | 包含的整理措施 |

| ------------ | ------------------------------------- | ------------------------------------------------------------ |

| 轻量清理 | 单脚本、实验性代码、临时项目 | 无用代码清理、空目录删除、明显命名问题修复 + 简要文档 |

| 标准整理 | 小型工具、数据处理管道、原型项目 | 轻量清理 + 命名规范 + import 排序 + 代码格式 + 类型标注 + 规范注释 + 标准文档 |

| 深度重构 | 可发布的小库、API 服务、完整 pipeline | 标准整理 + 目录结构重组 + src layout + init.py + 配置参数化 + 测试覆盖 + 分层架构 + 详细文档 |

| 全面重构 | 团队项目、商业产品级应用 | 深度重构 + DDD 设计 + 完整测试套件 + pyproject.toml + 完整文档 + 代码质量检查 |

向用户说明推荐级别及理由，等待用户确认或调整策略级别

第二轮：方案确认

基于用户选择的策略级别，生成详细的整理方案，包括：

具体的目录结构调整（如涉及）
每个需要修改的文件及修改类型
预计可移除的无用代码/依赖
新增的文件或配置

等待用户明确确认后方可开始执行

判断原则：

对于深度学习实验/数据处理原型项目：如果核心是跑通流程而非工程化，优先推荐轻量或标准策略
用户的策略选择是最终决定，推荐仅供参考
任何超出用户选择策略范围的优化，都不执行

工作流程

⚠️ 重要：防中断架构设计

核心原则：使用并行子代理拆分任务，避免单会话超时导致的中断

对于复杂项目重构（超过个文件需要修改），必须采用以下模式：

# 错误做法：串行执行所有操作
for file in files_to_modify:
 read(file) # 阻塞等待
 edit(file) # 阻塞等待

# 正确做法：并行子代理 + 进度持久化
phases = [
 {"id": "phase-a", "task": "创建目录结构"},
 {"id": "phase-b", "task": "移动文件到对应目录"},
 {"id": "phase-c", "task": "更新所有 import 路径"},
 {"id": "phase-d", "task": "统一变量命名和类型提示"},
 {"id": "phase-e", "task": "生成三个文档文件"}
]

for phase in phases:
 spawn_sub_agent(phase["id"], phase["task"]) # 并行启动

Phase 1: 扫描与策略选择（第一轮确认）

由主会话执行，轻量级操作

扫描项目 - 了解当前目录结构、代码规模、模块依赖关系

使用 exec 或 background=true 模式进行耗时操作（如 robocopy, tree）

 # 推荐：后台执行长时间任务
 cmd /c "robocopy E:\\LPR E:\\LPR_backup /MIR" > backup.log 2>&1 &

评估项目概况 - 统计以下信息：

文件数量、模块数量、项目类型（深度学习/Web/API/CLI/数据处理等）
当前存在的问题（目录混乱、命名不一致、代码重复、注释缺失等）

提出策略选择（第一轮确认） - 向用户展示：

项目概况摘要
四个策略级别及其包含的整理措施（见上方策略表）
推荐策略及理由
等待用户确认或调整策略级别

Phase 1.5: 方案制定（第二轮确认）

基于用户选择的策略级别，生成详细整理方案。

列出具体变更：

目录结构调整详情（如涉及）
每个需要修改的文件及修改类型
预计可移除的无用代码/依赖
新增的文件或配置
代码风格统一的具体规范

等待用户明确确认后方可进入执行阶段

Phase 2: 执行修改（并行子代理）

在收到明确批准后，按以下顺序通过 sub-agents 并行执行

# 主会话根据用户选择的策略级别选择任务
strategy = user_selected_strategy # "轻量清理" | "标准整理" | "深度重构" | "全面重构"
tasks = {
 # === 所有策略都适用 ===
 "code-cleanup": "清理无用代码和空目录",
# === 标准整理及以上 ===
 "style-unify": "代码风格统一（格式/命名/import/类型/注释）" if strategy in ["标准整理", "深度重构", "全面重构"] else None,
# === 深度重构及以上 ===
 "create-structure": "创建目录结构/.gitignore" if strategy in ["深度重构", "全面重构"] else None,
 "move-files-phase1": "移动核心脚本到对应目录" if strategy in ["深度重构", "全面重构"] else None,
 "config-extract": "配置参数化" if strategy in ["深度重构", "全面重构"] else None,
 "add-tests": "补充单元测试" if strategy in ["深度重构", "全面重构"] else None,
# === 全面重构 ===
 "quality-check": "代码质量与设计规范检查" if strategy == "全面重构" else None,
 "generate-docs": "生成三份文档" if strategy == "全面重构" else None,
}
tasks = {k: v for k, v in tasks.items() if v is not None} # 过滤掉不适用的任务
# 分批启动子代理（避免 token 溢出）
batch_size = 3 # 每批最多 3 个子代理
for i in range(0, len(tasks), batch_size):
 batch = tasks[i:i+batch_size]
 for task_id, task_desc in batch.items():
 sessions_spawn(
 agentId="main", 
 label=task_id,
 task=f"""执行代码整理任务：{task_desc}
注意事项：
 1. 使用相对路径操作文件
 2. 每个子代理只负责自己的任务
 3. 完成后将结果写入进度文件 memory/organize-progress.json
 4. 如果任何步骤失败，记录错误并继续其他步骤
输出格式：
 {{\"status\": \"success|failed\", \"task\": \"{task_id}\", 
 \"files_modified\": [...], \"errors\": [...]}}""")

A. 目录结构调整（子代理任务，深度重构及以上策略）

轻量/标准策略：保持现有结构，不做目录重组

深度重构及以上：

project-root/
├── src/ # 源代码
│ └── package_name/ # 主包
├── tests/ # 测试代码（可选）
├── configs/ # 配置文件（可选，参数 >3 时建议）
├── scripts/ # 辅助脚本、CLI 工具
├── docs/ # 项目文档（仅中型以上）
└── ...

根据项目类型可调整：

Web/API 应用 - src/app/routes.py, src/app/services/
数据处理项目 - src/pipeline/, data/, notebooks/
深度学习项目 - models/, trainers/, experiments/

B. 代码风格统一（子代理任务，标准整理及以上策略）

轻量清理策略跳过此步骤 - 标准整理及以上策略执行以下全部规则：

B1. 代码格式规范

行长限制：单行不超过 88 字符（Black 默认）或 120 字符（Ruff 推荐）
缩进：空格（Python PEP 8 标准），禁止混用 Tab 和空格
空行：顶层定义之间 2 空行，类方法之间 1 空行，函数内逻辑块之间可 1 空行
行尾：不保留多余空白字符，文件末尾保留一个换行符
引号：统一使用双引号 "（字符串内容含双引号时使用单引号 '）
运算符周围：二元运算符两侧各一个空格（a + b），一元运算符紧贴操作数（-x）
逗号后：跟一个空格（[1, 2, 3]）
工具推荐：使用 Black 或 Ruff format 自动格式化

B2. 命名规范

模块/包名：snake_case，简短描述性（data_loader.py，user_service/）
类名：PascalCase（DataLoader，UserService）
函数/方法：snake_case，动词开头（fetch_user()，validate_input()）
变量：snake_case，语义化命名（user_list 而非 ul，parsed_records 而非 data）
常量：UPPER_SNAKE_CASE（MAX_RETRIES = 3，API_BASE_URL）
私有成员：前导下划线（_internal_cache，__private_method）
布尔变量：is_/has_/can_/should_ 前缀（is_valid，has_permission）
避免：单字母变量（除 i/j/k 循环索引和数学公式外）、缩写（usr 为 user）

B3. Import 排序

遵循三段式分组 + 组内字母序：

# 1. 标准库
import os
import sys
from pathlib import Path

# 2. 第三方库
import numpy as np
import requests
from flask import Flask

# 3. 本地模块
from .config import Settings
from .models.user import UserModel
from utils.helpers import format_date

优先使用绝对导入，避免相对导入（模块移动时不会自动更新）
每组之间空一行
组内按字母顺序排列
从每个模块做具体导入（from .models.user import UserModel），而非 import models.user
工具推荐：使用 Ruff（I 规则）或 isort 自动排序

B4. 类型标注

函数签名：所有公共函数必须标注参数类型和返回类型

def fetch_user(user_id: int, include_deleted: bool = False) -> User | None:
 ...

类属性：在 __init__ 或类体中声明类型

class DataProcessor:
 batch_size: int = 32
 shuffle: bool = True

集合类型：使用具体泛型（list[str] 而非 list，dict[str, int] 而非 dict）
可选类型：使用 X | None（Python 3.10+）或 Optional[X]
联合类型：使用 A | B（Python 3.10+）或 Union[A, B]
复杂返回：使用 typing.TypeAlias 定义类型别名
不强求：内部工具函数、一次性脚本、lambda 表达式可省略

B5. 规范注释

注释哲学：注释是"必要的恶"。优先选择重命名而非写注释

必须添加注释的情况：

解释意图（why），而非描述做了什么（what）

✅ "使用 Adam 优化器因为收敛更快"
❌ "遍历列表"（代码已自解释）

法律条款/许可声明
警告副作用（并发注意事项、全局状态修改、网络 I/O）
不透明的第三方库行为解释
临时方案标记（# TODO:, # HACK:, # FIXME:）

Docstring 规范（公共函数/类必须）：

def process_data(records: list[Record], batch_size: int = 32) -> list[Batch]:
 """将记录列表分批处理
对输入记录进行过滤、转换和分批，返回处理后的批次列表
Args:
 records: 原始记录列表
 batch_size: 每个批次的记录数，默认 32
Returns:
 处理后的批次列表，每个批次包含最多 batch_size 条记录
Raises:
 ValueError: 当 records 为空或 batch_size 小于 1 时
"""

类 Docstring：

class DataProcessor:
 """高效处理并分批输入记录
处理记录的过滤、转换和分批操作，设计为可子类化
以支持自定义处理管道
Attributes:
 batch_size: 每批次记录数（默认 32）
 shuffle: 每个 epoch 是否打乱数据集
 num_workers: 数据加载的并行工作线程数
Example:
 >>> processor = DataProcessor(batch_size=64, shuffle=True)
 >>> for batch in processor:
 ... print(len(batch))
"""

行内注释规范：

放在代码上方（非右侧），复杂逻辑前留空行
以大写开头，句号结尾，完整句子
与代码保持相同缩进级别
# 后跟一个空格

禁止：

冗余注释（递增 i："i += 1"）
过时的注释（代码已改但注释未更新）
注释掉的代码块（应 git 历史追踪，不用注释保留）

C. 代码清理

移除未使用的 import 和变量
合并重复功能
标记过时的依赖

D. 冗余代码清理（新增）

深入分析并优化：

Dead Code Detection - 检测死代码

从未调用的函数/类
条件分支中永远不会执行的代码路径
被注释掉的遗留代码块

残余目录清理 - 删除重构后留下的空目录和旧文件：

识别并删除空目录：原算法目录（重构迁移后遗留的空子目录应在清理阶段移除）
移动或移除原始输入数据：如测试样本、演示文件等，根据项目原则放入 data/ 目录或删除
清理 .idea/, __pycache__/：确保所有 IDE 缓存、Python 字节码被排除在版本控制外
确认无重复文件：避免新旧代码在同一目录下共存

Duplicate Logic Removal - 消除重复逻辑

识别相似功能模块（如多个文件中的日志初始化）
提取为公共工具函数放入 utils/

Legacy Code Marking - 标记过时依赖

Python 2 兼容代码
已废弃的 API 调用
过时的第三方库版本

E. 配置参数化（深度重构及以上策略）

轻量/标准策略：不执行配置参数化。如果硬编码值不超过 3 个，保持 inline 即可
深度重构及以上策略或参数 >3 时：执行以下操作：

Magic Number Extraction - 魔法数字提取

# 改进前（参数超过 2-3 个）
api_client = create_client(host="api.example.com", port=8080, timeout=30)

# 改进后 - 通过配置文件
config = load_config("configs/default.yaml")
api_client = create_client(config.api.host, config.api.port, config.api.timeout_seconds)

YAML Configuration Structure - 标准配置格式
Command Line Override - 命令行参数优先（仅适用于 CLI/工具脚本）

F. 单元测试补充（深度重构及以上策略）

轻量/标准策略：不强制编写单元测试。原型代码、一次性实验脚本不需要测试覆盖。如果确实有核心逻辑需要验证，只写最简单的 assert 检查即可
深度重构及以上策略：为核心逻辑添加测试用例

Critical Path Coverage - 关键路径测试

I/O 操作（文件读写、网络请求）
核心业务逻辑/算法处理
数据验证与转换流程

Test Structure - 推荐测试结构
Test Framework Selection - 推荐框架（pytest 优先）
Minimum Test Coverage - 最低覆盖率要求 - 0%

Phase 3: 进度持久化与验证

每个子代理完成后必须写入进度文件

// memory/organize-progress.json (由主会话创建和维护)
{
 "project": "E:\\LPR",
 "started_at": "2026-04-28T00:00:00+08:00",
 "phases": {
 "create-structure": {"status": "completed", "files_created": [".gitignore"]},
 "move-files-phase1": {"status": "in_progress"},
 ...
 },
 "resumable": true,
 "last_checkpoint": "2026-04-28T00:05:00+08:00"
}

主会话在启动时检查进度：

如果存在 memory/organize-progress.json 且包含未完成阶段 - 跳过已完成阶段，继续执行剩余任务
如果文件不存在或项目未开始 - 从头开始

Phase 3.5: 代码质量与设计规范检查（全面重构策略）

核心原则：仅在用户选择全面重构策略时执行深度代码质量检查

A. 函数设计规范

长度 - 理想 4-10 行，不超过两三层缩进；超过则拆分子函数
参数数量 - 1-2 个最佳，>5 应使用配置对象/数据类封装
布尔参数是代码气味 - 一个布尔参数暗示函数做了两件不同的事，应拆分为两个独立函数（DoS 原则）
命令 - 查询分离 (CQS) - 函数要么执行动作（Command），要么返回信息（Query），不能两者兼顾

B. OOP SOLID 六大原则

对每个类用以下自检问题检验：

SRP (Single Responsibility) - 能否用 25 字以内描述其职责而不含 "if/and/or/but"？
OCP (Open-Closed) - 能否扩展行为而无需修改源码（开闭原则）？
LSP (Liskov Substitution) - 子类对象能否替换父类对象而不改变程序正确性？
ISP (Interface Segregation) - 接口是否足够小，消费者不依赖他们不使用的方法？
DIP (Dependency Inversion) - 高层模块是否依赖抽象而非具体实现？

C. 错误处理规范

异常优先于返回码 - 使用 try/except 替代检查特殊返回值
禁止返回或传递 None 表示"无" - Python 中应返回空列表 []、空字典 {} 等；仅在语义上确实可能缺失时才用 Optional[Type]
封装第三方 API - 将外部库调用包装在内部接口后，使代码可测试和 mock

D. 注释哲学

注释是"必要的恶"。优先选择重命名而非写注释。仅以下情况应添加注释：

解释意图（why），而非描述做了什么（what） - ✅ "使用 Adam 优化器因为收敛快"；❌ "遍历列表"
法律条款 / 许可声明
警告可能的后果（如副作用、并发注意事项）
对第三方/外部库行为的不透明之处做解释

E. Google-style Docstring 模板

公共函数/方法必须添加，遵循以下格式：

def fetch_user(user_id: int, include_deleted: bool = False) -> User | None:
 """Fetch a user by ID with optional deleted flag."""
 ...

class DataProcessor:
 """Efficiently processes and batches input records.
This class handles filtering, transformation, and batching of data.
It is designed to be subclassed for custom processing pipelines.
Attributes:
 batch_size: Number of records per batch (default: 32).
 shuffle: Whether to shuffle the dataset every epoch.
 num_workers: Number of parallel workers for data loading.
Example:
 >>> processor = DataProcessor(batch_size=64, shuffle=True)
 >>> for batch in processor:
 ... print(len(batch))
"""

F. 导入组织规则（Import Organization）

优先使用绝对导入 - 避免相对导入，因为模块移动时不会自动更新
标准库 - 第三方库 - 本地代码（三段式 + 空行分隔）
每组内部按字母顺序排列
从每个 import 组内做具体导入（如 from .models.resnet import ResNet50），而非 import models.resnet

文档生成规范

所有 4 级策略均生成三份文档（README.md、MODIFICATIONS.md、NOTE.md），区别在于详尽程度

| ------------ | ------------------------------------------- | ---------------------------------- | ------------------------------------ |

README.md - 用户面向文档

轻量清理 - 1-2 句话说明项目用途即可
标准整理 - 标准模板，包含 Features + Quick Start
深度重构 - 完整模板，包含 Features、Project Structure、Quick Start、Configuration、License
全面重构 - 完整模板，可额外包含架构图或流程图

~~~markdown

[项目名称]

[简短的项目描述 - 一句话概括项目目的]

Features

[功能 1]
[功能 2]
...

Project Structure

[新的目录结构树]

Quick Start

pip install -r requirements.txt
python main.py --config configs/default.yaml
~~~

## Configuration

[配置文件说明]

## License

[许可证信息，如已知]

要求：简洁明了，面向最终用户或使用者

CHANGELOG.md - 修改记录

轻量清理 - 仅列出修改的文件
标准整理 - 列出修改类别和关键变更
深度重构 - 详细变更记录 + 验证清单
全面重构 - 详细记录 + 常见问题排查 + 验证清单

# Modifications Log
## Directory Restructuring
- Moved `model.py` to `models/definition.py`
- Created `utils/helpers.py` from scattered functions
- ...
## Code Style Changes
- Renamed variable `raw_data` to `parsed_records` (semantic naming)
- Added type annotations to [N] functions
- Reorganized imports in [N] files
- ...
## Cleanup
- Removed unused import: `os.path.join` (replaced by `pathlib`)
- Consolidated duplicate validation logic into `utils/validators.py`
- ...
## Comment Updates
- Added docstrings to [N] functions
- Standardized comment format across all files

## Troubleshooting Notes（常见问题排查）
### 问题 1: [错误描述]
**原因**: [根本原因分析]
**解决**: [解决方案步骤]

---
验证清单：
- [x] 所有 import 路径已更新
- [x] 类型提示已添加

要求：具体、可追溯，列出实际变更项。轻量策略可简化为文件列表

NOTE.md - 个人笔记（中文）

轻量清理 - 1-2 句话说明项目用途
标准整理 - 标准模板（用途 + 快速开始 + 技术栈）
深度重构 - 完整模板（含常用配置表）
全面重构 - 完整模板 + 注意事项

~~~markdown

[项目名称] 笔记

项目用途

[用一两句中文概括这个项目是做什么的、解决什么问题]

快速开始

# 安装依赖
pip install -r requirements.txt
# 基本使用示例
python main.py [options]
~~~

## 常用配置（按需调整）

| 配置项   | 说明                           |
| -------- | ------------------------------ |
| [配置 A] | [默认值/建议范围] - [简要用途] |
| [配置 B] | [默认值/建议范围] - [简要用途] |

## 技术栈

- [技术栈描述，如 Python + Flask / Node.js / etc.]

要求：保持精简（不超过一页），中文撰写，只包含核心使用信息。不要包含修改记录、常见问题排查、代码改进说明等内容

⚠️ 三文件不重叠原则

| 文件 | 侧重 |

|------|--------|

| README.md | 是什么 + 怎么用 - 面向外部用户 |

| CHANGELOG.md | 改了什么 - 变更历史记录 |

| NOTE.md | 项目概况 - 个人快速参考 |

避免内容重复：README 不记录修改细节，MODIFICATIONS 不解释功能用途，NOTE 不做详细技术文档

安全注意事项

始终先分析再行动 - 不要擅自修改任何文件
保留原始备份意识 - 如果用户要求，可建议创建 git 快照
不做破坏性操作 - 不删除未确认的文件或代码
尊重项目现有结构 - 除非有明显改进空间

PyTorch / 深度学习项目特殊处理

针对深度学习项目的额外考虑（如适用）：

模型文件：models/ 目录下按架构分类（如 models/resnet.py, models/custom_net.py）
数据：data/ 或 datasets/，区分预处理和原始数据路径
实验管理：建立 experiments/ 目录存放训练脚本、checkpoint、日志
配置优先：将超参数（batch_size, lr, epochs 等）提取到 configs/ YAML 文件
日志输出：确保有统一的 logging 机制（建议用 Python stdlib logging 或 loguru）

Web / API 应用特殊处理

针对 Web/API 项目的额外考虑：

路由组织 - FastAPI/Flask 按资源划分路由（routes/users.py, routes/orders.py）
中间件与鉴权 - 认证逻辑独立为 middleware 或 service
数据库迁移 - Alembic 或类似工具管理 schema 变更

CLI / 数据处理项目特殊处理

针对命令行工具和 ETL 管道的额外考虑：

配置集中 - 配置文件 + argparse / Typer，确保参数可追溯
日志与进度 - rich / click 的进度条支持，便于长时运行的管道监控

Python 项目结构规范（补充）

A. init.py 作为公共 API 边界（深度重构及以上策略）

轻量/标准策略 / Flat Layout - 通常不需要 __init__.py，也不需要 __all__
深度重构及以上且使用 src layout -
__init__.py 不应包含业务逻辑，仅用于重新导出子模块的公开接口
使用 __all__ 显式声明公共 API - 不在列表中的 symbol 视为私有

```python

# __init__.py

from .user_service import UserService

from .auth import AuthProvider

__all__ = ["UserService", "AuthProvider"]


- 消费者应 `import package` 然后使用公开符号，而非直接 `import package.inner_module`

### B. src/ vs Flat Layout - 决策框架

| 特征         | src/ layout（推荐）                               | Flat layout                              |
| ------------ | ------------------------------------------------- | ---------------------------------------- |
| **适用场景** | 库、可发布项目、测试需要模拟包导入                | 简单脚本、一次性分发/Notebook            |
| **优点**     | 防止误用未安装包运行；`pip install -e .` 行为一致 | 结构简单，路径简单                       |
| **缺点**     | 多一层目录嵌套                                    | 开发时可能无意中导入本地模块而非安装的包 |

- **深度重构及以上策略** - 建议使用 `src/` layout：`src/package_name/` + `tests/`
- **轻量/标准策略 / Flat Layout** - 保持扁平结构即可（如 `main.py`, `utils.py`, `config.yaml`）
- 现有 flat 项目无需强制迁移，除非有明确的包隔离需求

### C. Layered Architecture - 分层架构（全面重构策略）

- **轻量/标准/深度重构策略** - **不要强行拆分多层**。保持现有结构或轻度重组即可
- **全面重构策略且涉及多模块交互时**，按技术栈分层（从高层到低层），依赖只能单向向下：

api/ # FastAPI/Flask 路由、请求/响应模型

services/ # 业务逻辑入口点，调用 repositories

repositories/ # 数据访问层，与数据库/外部 API 交互

models/ # Pydantic 模型 / SQLAlchemy ORM

schemas/ # DTOs, input validation schemas

config/ # 配置加载、环境管理


- 每层只能 `import` 下层模块，禁止跨层或反向导入
- 通过依赖注入（构造函数参数）而非全局实例来耦合层间关系

### D. Domain-Driven Organization（DDD 风格，全面重构策略）

当项目复杂度较高且用户选择全面重构策略时，按业务域划分而非技术层：

users/ # 用户域

├── models.py # 领域模型

├── services.py # 领域服务

└── api.py # API 端点

orders/ # 订单域

...

shared/ # 跨域的公共基础设施（日志、缓存等）


- DDD 结构适用于团队多人协作的大型项目
- 轻量/标准/深度重构策略仍推荐传统的 layered architecture，避免过度工程化

### E. 模块粒度 - "一个概念一个文件"（深度重构及以上策略）

- **拆分阈值**：单个文件超过 300-500 行或处理多个不相关职责时应拆分为独立文件
- **文件命名**：`snake_case`、描述性强（如 `user_repository.py`，而非 `repo.py`）
- **类名与文件名匹配**：`UserService` 应放入 `user_service.py`

### F. 测试组织 - Co-located vs Parallel（深度重构及以上策略）

- **轻量/标准策略** - **不写单元测试**

- 深度重构及以上策略

   \- 两种策略任选其一并在整个项目中保持一致：

  | 策略                   | 结构                                  | 适用场景                          |
  | ---------------------- | ------------------------------------- | --------------------------------- |
  | **Co-located**（推荐） | `tests/test_<module>.py` 与源码同目录 | 小型项目、测试逻辑与实现紧密相关  |
  | **Parallel directory** | `tests/` 镜像 `src/` 目录结构         | 大型项目、CI 需要独立运行所有测试 |

### G. pyproject.toml - 工具链配置（全面重构策略，或发布为库时）

- **轻量/标准/深度重构策略** - 不需要。脚本直接运行即可
- **全面重构策略 / 需要发布到 PyPI 的项目**：在根目录创建 `pyproject.toml`

[tool.ruff]

line-length = 120

target-version = "py311"

[tool.ruff.lint]

select = ["E", "W", "F", "I", "B", "UP", "SIM"]

E/W: pycodestyle, F: Pyflask, I: isort, B: bugbear, UP: pyupgrade, SIM: simplify

[tool.ruff.lint.per-file-ignores]

"tests/*/" = ["S101"] # allow assert in tests

"__init__.py" = ["F401"] # unused imports are re-exports by convention

[tool.mypy]

python_version = "3.11"

warn_return_any = true

warn_unused_configs = true

disallow_untyped_defs = false # production code: true; tests: override to false


------

## ⚠️ 避免过度工程化 - 具体禁令

以下行为**不应默认执行**，仅在用户明确选择对应策略级别或明确提出需求时才执行：

1. **不要为只有几个变量的脚本创建 YAML/TOML 配置文件 + argparse CLI** - inline 参数更简单（除非用户选择深度重构及以上策略）
2. **不要将简单的函数拆分成多个子函数以符合 4-10 行规则** - 保持逻辑完整性优先于行数限制（除非用户选择全面重构策略）
3. **不要在扁平布局的项目中强制创建 `__init__.py` + `__all__`** - 除非用户选择深度重构及以上策略
4. **不要对只有一个类的文件做 SRP/OCP/LSP/ISP/DIP 分析** - OOP 原则只在存在继承和多态关系时才适用（除非用户选择全面重构策略）
5. **不要为只有几个文件的深度学习/数据处理项目创建完整的分层架构或 DDD 结构** - 除非用户选择全面重构策略
6. **不要在原型代码中强制要求单元测试和覆盖率阈值** - 除非用户选择深度重构及以上策略
7. **不要对只有一两个使用者的内部工具生成 README + MODIFICATIONS + NOTE 三份文档** - 除非用户选择对应策略级别
8. **不要将 `main.py` 强行塞进 `src/package_name/` 的目录结构中** - src layout 只对库或大型应用有意义（除非用户选择深度重构及以上策略）

> **核心原则：优化是为了让人更容易理解和维护代码，不是为了达到最佳实践。如果改动让项目变得更复杂而不是更简单，那就做过头了。用户的策略选择是最终决定**

版本历史

共 4 个版本

v1.1.0 · 将原有的自动规模判断改为用户主导的四级策略选择，每次整理经过两轮确认（策略选择→方案确认）才执行，避免过度工程化； · 代码风格整理扩展为五维度（格式/命名/import/类型/注释）； · 所有策略均生成三份文档（README.md、CHANGELOG.md、NOTE.md），详尽程度随策略递增； · 修改记录文档更名为 CHANGELOG.md。当前

2026-04-30 23:18 安全安全
v1.0.2 Initial release

2026-04-28 18:19 安全安全
v1.0.1 Initial release

2026-04-28 01:12 安全安全
v1.0.0 Initial release

2026-04-28 00:21 安全安全

Code Organizer

概述