← 返回
未分类 Key 已验

公众号搜索爬虫

公众号搜索爬虫 — 通过关键词搜索微信公众号文章,终端表格展示(标题/作者/阅读/点赞/分享/收藏/发布时间/文章链接),自动导出 CSV 并生成交互式 HTML 报告。当用户需要搜索、爬取或浏览公众号文章时使用;也适用于行业热点追踪、竞品内容分析、素材灵感搜集等场景。
公众号搜索爬虫 — 通过关键词搜索微信公众号文章,终端表格展示(标题/作者/阅读/点赞/分享/收藏/发布时间/文章链接),自动导出 CSV 并生成交互式 HTML 报告。当用户需要搜索、爬取或浏览公众号文章时使用;也适用于行业热点追踪、竞品内容分析、素材灵感搜集等场景。
红狐数据 redfox-data 来源
未分类 clawhub v1.0.1 2 版本 100000 Key: 需要
★ 0
Stars
📥 181
下载
💾 0
安装
2
版本
#latest

概述

公众号搜索爬虫

输入关键词搜索微信公众号文章,终端表格展示 + CSV 导出 + 交互式 HTML 报告。

> API 请求均携带 公众号搜索爬虫-SkillHub 标识。需先配置 API Key,通过环境变量 REDFOX_API_KEY 或 --api-key 参数传入。

> 爬取范围:腰部以上公众号近 30 天内发布的文章。

> 关键词限制:不超过 10 个字符,超出会提示精简。


使用场景

当你需要执行以下任务时,应优先使用本技能:

场景示例
------------
行业热点追踪搜 "AI" 了解近期 AI 领域公众号都在讨论什么
竞品内容分析搜 "大模型" 爬取竞争对手公众号的文章策略
素材灵感搜集搜 "小红书运营" 获取爆款选题和写作角度
趋势研究报告搜 "2026 经济" 批量导出 CSV 做数据分析
寻找优质账号搜 "科技" 发现相关领域的头部公众号
话题舆情监控搜 "品牌名" 查看公众号对该品牌的讨论风向

> 如果你想搜某个特定公众号的全部历史文章,应使用 gzh-subscribe 技能(公众号文章订阅),它专门针对单账号订阅追踪。


使用方法

# 基础搜索
python3 "$SKILL_PATH/assets/search.py" "关键词"

# 指定数量(多页自动翻页)
python3 "$SKILL_PATH/assets/search.py" "AI" --count 50

# 仅导出 CSV
python3 "$SKILL_PATH/assets/search.py" "大模型" --csv-only

# 不自动打开浏览器
python3 "$SKILL_PATH/assets/search.py" "AI" --no-open

终端输出按综合评分(关键词相关性 + 阅读热度 + 时效新鲜度)降序排列,同分时按阅读量高的优先;结果较少或无结果时自动分层提示。

HTML 报告特性:深色主题 · 实时搜索(300ms 防抖)· 文章卡片点击跳转原文 · 分页加载 · 零结果时引导热门话题。

CSV / HTML 默认保存在 ~/Downloads/QoderGzhSearch/


参数说明

参数说明默认值
--------------------
keyword搜索关键词(必填,位置参数)
--count获取文章数量20
--sort-type排序方式:default / timedefault
--output-dir输出目录~/Downloads/QoderGzhSearch
--api-key指定 API Key
--no-open不自动打开浏览器
--csv-only仅生成 CSV,不生成 HTML
--portHTML 本地服务端口8766

API Key 配置

任选一种方式配置个人 Key:

方式命令
------------
环境变量(推荐)export REDFOX_API_KEY=ak_你的密钥
命令行参数--api-key ak_你的密钥
配置文件echo '{"api_key":"ak_你的密钥"}' > ~/.qoder/apis/redfox.json

注册地址:redfox.hk


功能特点

  • 关键词搜索:实时查询全量微信公众号文章
  • 智能评分排序:三因子(相关性 + 热度 + 时效)综合评分,同分按阅读量降序
  • 分层响应降级:充足时正常浏览 / 较少时引导宽泛搜索 / 无结果时热门兜底
  • 终端表格:标题、作者、阅读、点赞、分享、收藏、发布时间、文章链接
  • CSV 导出:自动生成 UTF-8 BOM 编码的 CSV
  • HTML 交互报告:内置搜索框,支持封面图展示,点击卡片跳转原文
  • 本地代理服务:避免浏览器跨域限制

依赖

pip3 install requests

常见问题

Q:搜索范围?

A:目前覆盖腰部以上公众号近 30 天内发布的文章,不保证覆盖所有账号和全部历史。

Q:我想搜某个特定公众号的所有文章怎么办?

A:请使用 gzh-subscribe 技能(公众号文章订阅),它支持按公众号 ID 订阅追踪单账号的全部文章。

Q:最多返回多少条?

A:单次默认 20 条,通过 --count 调整,HTML 页面支持分页加载更多。

Q:数据保存在哪?

A:~/Downloads/QoderGzhSearch/,文件名格式 公众号搜索_[关键词]_YYYY-MM-DD.csv/html

Q:为什么需要本地服务?

A:浏览器直接打开 HTML 有跨域限制,内置 HTTP 代理中转 API 请求。

Q:额度用完怎么办?

A:前往 redfox.hk 注册获取 Token。

版本历史

共 2 个版本

  • v1.0.1 当前
    2026-06-13 18:59 安全 安全
  • v1.0.0
    2026-06-03 13:33

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 218 📥 71,637
data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 298 📥 143,066
data-analysis

Tavily 搜索

jacky1n7
通过 Tavily API 进行网页搜索(Brave 替代方案)。当用户要求搜索网页、查找来源或链接,且 Brave 网页搜索不可用时使用。
★ 278 📥 101,616