← 返回
未分类

微信文章格式转换

将微信文章转换为 Markdown/HTML/Text/JSON/Excel五种格式,无需登录,直接抓取,图片和样式本地化保留。
罗江勇
未分类 community v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 280
下载
💾 34
安装
1
版本
#latest

概述

> 将微信文章转换为离线的 Markdown/HTML/Text/JSON/Excel,无需登录,直接抓取,图片和样式本地化保留。

微信公众号文章抓取

触发条件

用户发送:

  • 微信文章链接:https://mp.weixin.qq.com/s/xxx
  • 多个链接(换行或空格分隔)
  • 「帮我转这篇文章」「保存这篇微信文章」「下载这篇文章」

每次导出前必须询问格式(必须)

用户: https://mp.weixin.qq.com/s/xxx
→ 询问: "请选择导出格式(支持单选或多选,例如:1 或 1,3,5 或 markdown,html)"

可选格式:

序号格式扩展名说明
--------------------------
1Markdown.md带标题/作者/日期/来源链接
2Excel.xlsx表格,含元信息+正文(行高300px)
3HTML.html独立网页,CSS+图片本地化,浏览器直接打开
4纯文本.txt无格式纯文字
5JSON.json结构化,含完整元数据

格式选择解析(不区分大小写):

  • 单选:2 / excel / Excel
  • 多选:1,3,5 / markdown,html,json / 1 和 3

HTML 格式详解

HTML 是离线阅读效果最好的格式,结构如下:

文章标题_文章ID/
├── index.html        # 完整网页(CSS引用+图片引用)
└── assets/           # 资源文件夹
    ├── *.css         # 样式文件(18个,共约3MB)
    └── *.jpg/png/webp # 图片文件

生成策略:

  • 保留微信原始 HTML 结构(
  • 下载所有 CSS/图片到 assets/,用时间戳文件名
  • 替换所有资源 URL 为本地相对路径 href="./assets/xxx"
  • CSS/图片按内容 hash 去重(相同资源只存一份)
  • #js_contentvisibility:hidden 样式自动移除(防空白页)
  • #js_article_bottom_bar 底部栏自动保留
  • MINIMAL_CSS 内联到