← 返回
内容创作

wechat-article-skill

微信公众号文章链接处理。当用户发送微信公众号文章链接时,自动获取并提取文章内容。 触发条件:(1) 用户发送 http(s)://mp.weixin.qq.com/s/ 开头的链接 (2) 用户请求获取公众号文章内容
微信公众号文章链接处理。当用户发送微信公众号文章链接时,自动获取并提取文章内容。 触发条件:(1) 用户发送 http(s)://mp.weixin.qq.com/s/ 开头的链接 (2) 用户请求获取公众号文章内容
alienhub
内容创作 clawhub v0.0.1 1 版本 100000 Key: 无需
★ 1
Stars
📥 510
下载
💾 82
安装
1
版本
#latest

概述

微信公众号文章获取

识别公众号链接

公众号文章链接特征:

  • 域名: mp.weixin.qq.com
  • 路径: /s/ 开头
  • 示例: https://mp.weixin.qq.com/s/abc123def456

获取文章内容的方法

> ⚠️ 微信服务器会检测请求头,必须携带正常浏览器的 User-Agent,否则返回 403。

Agent 调用顺序(重要)

  1. 优先使用 get_content.py 脚本 —— 稳定、无头、输出直接供模型消费。
  2. 仅在脚本失败时改用 browser 工具 —— 脚本 stderr 会输出「建议 Agent 改用 browser 工具」等提示,此时再考虑浏览器。

方法一:get_content.py 脚本(首选)

本地 CLI,urllib + certifi + 真实 UA,自带重试(最多 3 次)。失败时 stderr 提示是否改用 browser。

# 安装依赖(首次)
pip install -r requirements.txt

# 调用
python scripts/get_content.py --url "https://mp.weixin.qq.com/s/xxx"
  • 成功:正文输出到 stdout。
  • 失败:stderr 输出原因及「建议 Agent 改用 browser 工具」。

方法二: browser 工具(脚本失败时的回退)

仅在脚本返回非 0 且 stderr 建议改用 browser 时使用:

browser(action="navigate", url="用户发送的链接")
browser(action="snapshot")

内容提取要点

公众号页面结构:

  • 文章正文在 #page-content 元素中
  • 标题通常在 #activity-nameh1 标签
  • 作者信息在 .account_nickname 或类似元素
  • 发布时间需要从页面元数据提取

处理流程

  1. 识别链接 → 检测到 mp.weixin.qq.com/s/ 链接
  2. 获取内容 → 调用 get_content.py --url <链接>
  3. 成功 → 正文在 stdout,直接供模型消费
  4. 失败 → 检查 stderr,若建议改用 browser,再用 browser 工具重试

注意事项

  • 公众号文章可能需要登录才能完整抓取
  • 部分文章有访问时间限制
  • 图片可能需要单独处理(使用微信图床域名)
  • 必须使用正常浏览器的 User-Agent

版本历史

共 1 个版本

  • v0.0.1 当前
    2026-03-30 01:58 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

content-creation

Humanizer

biostartechnology
消除AI写作痕迹,使文本更自然真实。基于维基百科"AI写作特征"指南,识别并修正夸张象征、宣传用语、肤浅-ing分析、模糊归因、破折号滥用、三项排比、AI词汇、负面平行结构及冗长连接词等模式。
★ 857 📥 199,431
content-creation

Baidu Wenku AIPPT

ide-rea
使用百度文库 AI 智能生成 PPT,自动根据内容选择模板。
★ 66 📥 46,148
content-creation

YouTube

byungkyu
使用托管OAuth集成YouTube Data API,支持搜索视频、管理播放列表、获取频道数据及评论互动,适用于用户需要时使用此技能。
★ 142 📥 41,033