自动从微信公众号文章数据中筛选、抓取原文、精炼简介、生成排版精美的 HTML 周报。最终产出可从浏览器直接复制粘贴到微信公众号编辑器,标题超链接自动保留。
requests 库
sync_state.json(wewe-rss 数据源)和 gen_weekly_report.py、_gen_weekly_html.py 两个脚本
执行命令:
cd 工作目录
python gen_weekly_report.py --days 7
脚本自动完成:
sync_state.json 按 published_at 筛选最近7天文章
_body_cache.json
paywalled
输出:
周报/_raw_articles.json:本周文章数据
周报/精神分析周报 · MM月DD日-MM月DD日.txt:TXT骨架版(无简介)
读取 周报/_raw_articles.json,基于每篇的 body 字段(正文前200字)精炼简介:
paywalled: true)写"本文为付费内容,无法获取正文。"
生成带简介的 TXT 周报,覆盖步骤1的 TXT 文件。
TXT格式要求:
【文章标题】
来源:公众号名称
发布时间:MM-DD HH:MM
简介:30-40字的简介内容。
链接:https://mp.weixin.qq.com/s/xxxxx
执行命令:
python _gen_weekly_html.py
脚本自动读取 _raw_articles.json 和最新 TXT 文件,生成排版精美的 HTML。
输出:周报/精神分析周报 · MM月DD日-MM月DD日.html
published_at(真实发布时间),不用 imported_at
.000Z后缀)需+8小时转北京时间
| 规模 | 总计 |
|------|------|
| 20篇 | ~7K |
| 50篇 | ~18K |
| 60篇 | ~22K |
分批建议:>50篇分2-3批处理。
共 1 个版本