scripts/duplicate_scanner.py 执行扫描:```bash
python /workspace/projects/duplicate-file-cleaner/scripts/duplicate_scanner.py \
--directory <扫描目录> \
--strategy comprehensive \
--output scan_report.json
```
--directory:必填,要扫描的目录--strategy:识别策略(comprehensive/综合、content/内容、metadata/元数据)--output:输出报告文件路径--min-size:最小文件大小(字节),默认 1024--extensions:文件扩展名过滤(如 jpg,png,pdf)scripts/risk_assessor.py 评估操作风险:```bash
python /workspace/projects/duplicate-file-cleaner/scripts/risk_assessor.py \
--input scan_report.json \
--output risk_report.json
```
scripts/file_organizer.py 整理文件:```bash
python /workspace/projects/duplicate-file-cleaner/scripts/file_organizer.py \
--directory <源目录> \
--output <目标目录> \
--strategy type \
--dry-run
```
type:按文件类型(图片、文档、音频等)date:按创建/修改日期size:按文件大小(小、中、大、超大)scripts/safety_manager.py 执行安全删除:```bash
python /workspace/projects/duplicate-file-cleaner/scripts/safety_manager.py \
--delete \
--files <文件列表> \
--backup-first
```
--dry-run 预览模式comprehensive:最准确,速度较慢(推荐)content:仅识别内容完全相同的文件metadata:速度快,可能包含误报# 综合扫描照片
python scripts/duplicate_scanner.py \
--directory ~/Pictures \
--strategy comprehensive \
--output photos_report.json
# 评估风险
python scripts/risk_assessor.py \
--input photos_report.json \
--output photos_risk.json
智能体分析后建议保留拍摄时间最早的版本,并标注可能的重要照片。
# 扫描下载目录
python scripts/duplicate_scanner.py \
--directory ~/Downloads \
--strategy content \
--output downloads_report.json
# 安全删除(先备份)
python scripts/safety_manager.py \
--delete \
--files duplicate1.jpg,duplicate2.pdf \
--backup-first
智能体会识别重复下载的资源文件,推荐删除多余副本,并保留原始文件。
# 按文件类型预览整理
python scripts/file_organizer.py \
--directory ~/Documents/Work \
--output ~/Organized/Work \
--strategy type \
--dry-run
# 确认后执行
python scripts/file_organizer.py \
--directory ~/Documents/Work \
--output ~/Organized/Work \
--strategy type \
--execute
智能体会按文档、表格、演示文稿等分类整理,并提供文件移动预览。
# 使用元数据策略快速扫描
python scripts/duplicate_scanner.py \
--directory ~ \
--strategy metadata \
--min-size 102400 \
--output full_scan.json
智能体会提示可能需要较长时间,并建议优先处理大文件和高风险目录。
共 2 个版本