Chrome 书签整理器,用于解析、分析和整理浏览器书签文件。
本技能提供一套完整的书签整理工具,支持:
-f 参数指定 markdown/text/all)书签HTML → 解析器 → 中间产物JSON → 分析器 → 分类建议
↓ ↓
链接检测器 ← → AI 分类
↓ ↓
整理器 ←────────┘
↓
生成器 → 新书签HTML
将 Chrome 导出的书签 HTML 解析为结构化 JSON:
python scripts/parser.py /path/to/bookmarks.html --stats
输出:
output/bookmarks.json - 结构化书签数据output/bookmarks_stats.json - 统计信息(可选)分析书签数据,进行规则分类,生成 AI 分类批次:
python scripts/analyzer.py output/bookmarks.json --generate-prompts
输出:
output/analysis.json - 分析结果output/ai_prompts/ - AI 分类提示词文件(可选)批量检测书签 URL 有效性:
python scripts/link_checker.py output/bookmarks.json
输出:
output/link_status.json - 链接检测结果根据分析结果和链接状态整理书签:
python scripts/organizer.py output/analysis.json \
-l output/link_status.json \
-a output/ai_suggestions.json # 如有 AI 建议
输出:
output/organized.json - 整理后的书签数据生成可导入 Chrome 的 HTML 文件:
python scripts/generator.py output/organized.json
输出:
output/bookmarks_organized_YYYYMMDD_HHMMSS.html解析 Netscape Bookmark File HTML,提取书签和文件夹信息。
python scripts/parser.py <input.html> [options]
选项:
-o, --output DIR 输出目录
-n, --name NAME 输出文件名前缀
--stats 生成统计信息
分析书签数据,进行规则分类,生成 AI 分类批次。
python scripts/analyzer.py <input.json> [options]
选项:
-o, --output DIR 输出目录
-c, --config FILE 配置文件
-n, --name NAME 输出文件名前缀
--generate-prompts 生成 AI 分类提示词
异步批量检测 URL 有效性。需要 aiohttp 库(未安装时使用同步模式)。
python scripts/link_checker.py <input.json> [options]
选项:
-o, --output DIR 输出目录
-c, --config FILE 配置文件
--concurrency N 并发数(默认 20)
--timeout N 超时秒数(默认 5)
在每个目录内部将书签分类到已有子目录或新建子目录,不跨文件夹移动。
python scripts/organizer.py <bookmarks.json> [options]
选项:
-a, --ai-suggestions FILE AI 分类建议文件
-l, --link-status FILE 链接状态文件
-c, --config FILE 配置文件
--threshold FLOAT AI 置信度阈值
整理逻辑:
将整理后的数据输出为 Chrome 可导入的 HTML。
python scripts/generator.py <organized.json> [options]
选项:
-o, --output FILE 输出 HTML 文件路径
--no-icons 不包含图标
--flat 平铺输出(不按分类)
--exclude CAT... 排除指定分类
生成书签健康评估报告,包含评分、统计分析和趣味点评。
python scripts/reporter.py <bookmarks.json> <organized.json> [options]
选项:
-o, --output DIR 输出目录
-f, --format FORMAT 输出格式(默认: html)
可选: text / markdown / html / both / all
默认只生成 HTML 报告。如需 Markdown 或文本格式,使用 -f 指定:
# 只生成 HTML(默认)
python scripts/reporter.py bookmarks.json organized.json -o output/
# 生成所有格式
python scripts/reporter.py bookmarks.json organized.json -o output/ -f all
# 只生成 Markdown
python scripts/reporter.py bookmarks.json organized.json -o output/ -f markdown
对于规则无法分类的书签,可使用 AI 进行智能分类:
analyzer.py --generate-prompts 生成提示词文件organizer.py -a 进行整合AI 建议格式:
[
{
"bookmark_id": "abc123",
"suggested_category": "tech",
"confidence": 0.85,
"reason": "GitHub 技术项目"
}
]
配置文件位于 assets/config_template.json,可复制后自定义。
主要配置项:
classification.rules - 分类规则(域名、关键词)link_checker - 链接检测参数ai_classification - AI 分类设置output - 输出格式设置详细规则说明见 references/classification_rules.md。
安装可选依赖:
pip install aiohttp beautifulsoup4
bookmark-organizer/
├── SKILL.md # 本文件
├── scripts/
│ ├── utils.py # 工具函数
│ ├── parser.py # 书签解析器
│ ├── analyzer.py # 分析器
│ ├── link_checker.py # 链接检测器
│ ├── organizer.py # 整理器
│ ├── generator.py # 生成器
│ └── reporter.py # 评估报告生成器
├── references/
│ └── classification_rules.md # 分类规则文档
└── assets/
└── config_template.json # 配置模板
共 1 个版本