← 返回
未分类 Key

公众号搜索爬虫

公众号搜索爬虫 — 通过关键词搜索微信公众号文章,终端表格展示(标题/作者/阅读/点赞/分享/收藏/发布时间/文章链接),自动导出 CSV 并生成交互式 HTML 报告。当用户需要搜索、爬取或浏览公众号文章时使用;也适用于行业热点追踪、竞品内容分析、素材灵感搜集等场景。
路元亿
未分类 enterprise v1.0.1 100000 Key: 需要
★ 0
Stars
📥 30
下载
💾 0
安装

概述

公众号搜索爬虫

输入关键词搜索微信公众号文章,终端表格展示 + CSV 导出 + 交互式 HTML 报告。

> API 请求均携带 公众号搜索爬虫-SkillHub 标识。需先配置 API Key,通过环境变量 REDFOX_API_KEY 或 --api-key 参数传入。

> 爬取范围:腰部以上公众号近 30 天内发布的文章。

> 关键词限制:不超过 10 个字符,超出会提示精简。


使用场景

当你需要执行以下任务时,应优先使用本技能:

场景示例
------------
行业热点追踪搜 "AI" 了解近期 AI 领域公众号都在讨论什么
竞品内容分析搜 "大模型" 爬取竞争对手公众号的文章策略
素材灵感搜集搜 "小红书运营" 获取爆款选题和写作角度
趋势研究报告搜 "2026 经济" 批量导出 CSV 做数据分析
寻找优质账号搜 "科技" 发现相关领域的头部公众号
话题舆情监控搜 "品牌名" 查看公众号对该品牌的讨论风向

> 如果你想搜某个特定公众号的全部历史文章,应使用 gzh-subscribe 技能(公众号文章订阅),它专门针对单账号订阅追踪。


使用方法

# 基础搜索
python3 "$SKILL_PATH/assets/search.py" "关键词"

# 指定数量(多页自动翻页)
python3 "$SKILL_PATH/assets/search.py" "AI" --count 50

# 仅导出 CSV
python3 "$SKILL_PATH/assets/search.py" "大模型" --csv-only

# 不自动打开浏览器
python3 "$SKILL_PATH/assets/search.py" "AI" --no-open

终端输出按综合评分(关键词相关性 + 阅读热度 + 时效新鲜度)降序排列,同分时按阅读量高的优先;结果较少或无结果时自动分层提示。

HTML 报告特性:深色主题 · 实时搜索(300ms 防抖)· 文章卡片点击跳转原文 · 分页加载 · 零结果时引导热门话题。

CSV / HTML 默认保存在 ~/Downloads/QoderGzhSearch/


参数说明

参数说明默认值
--------------------
keyword搜索关键词(必填,位置参数)
--count获取文章数量20
--sort-type排序方式:default / timedefault
--output-dir输出目录~/Downloads/QoderGzhSearch
--api-key指定 API Key
--no-open不自动打开浏览器
--csv-only仅生成 CSV,不生成 HTML
--portHTML 本地服务端口8766

API Key 配置

任选一种方式配置个人 Key:

方式命令
------------
环境变量(推荐)export REDFOX_API_KEY=ak_你的密钥
命令行参数--api-key ak_你的密钥
配置文件echo '{"api_key":"ak_你的密钥"}' > ~/.qoder/apis/redfox.json

注册地址:redfox.hk


功能特点

  • 关键词搜索:实时查询全量微信公众号文章
  • 智能评分排序:三因子(相关性 + 热度 + 时效)综合评分,同分按阅读量降序
  • 分层响应降级:充足时正常浏览 / 较少时引导宽泛搜索 / 无结果时热门兜底
  • 终端表格:标题、作者、阅读、点赞、分享、收藏、发布时间、文章链接
  • CSV 导出:自动生成 UTF-8 BOM 编码的 CSV
  • HTML 交互报告:内置搜索框,支持封面图展示,点击卡片跳转原文
  • 本地代理服务:避免浏览器跨域限制

依赖

pip3 install requests

常见问题

Q:搜索范围?

A:目前覆盖腰部以上公众号近 30 天内发布的文章,不保证覆盖所有账号和全部历史。

Q:我想搜某个特定公众号的所有文章怎么办?

A:请使用 gzh-subscribe 技能(公众号文章订阅),它支持按公众号 ID 订阅追踪单账号的全部文章。

Q:最多返回多少条?

A:单次默认 20 条,通过 --count 调整,HTML 页面支持分页加载更多。

Q:数据保存在哪?

A:~/Downloads/QoderGzhSearch/,文件名格式 公众号搜索_[关键词]_YYYY-MM-DD.csv/html

Q:为什么需要本地服务?

A:浏览器直接打开 HTML 有跨域限制,内置 HTTP 代理中转 API 请求。

Q:额度用完怎么办?

A:前往 redfox.hk 注册获取 Token。

版本历史

共 2 个版本

  • v1.0.1 New version 当前
    2026-06-12 14:57 安全 安全
  • v1.0.0 Initial release
    2026-06-05 15:43 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

抖音作品查询

u_b1ef8fd0
抖音爆款作品查询工具。根据关键词搜索抖音热门爆款作品,支持按日期范围筛选,结果以结构化表格展示。当用户查找抖音热门内容、搜索抖音爆款视频、查询抖音作品数据时使用。触发词:抖音爆款、抖音热门、抖音热榜、抖音作品查询、抖音搜索、爆款视频、热门视
★ 0 📥 82

小红书笔记优化助手

u_b1ef8fd0
小红书笔记优化助手工具,基于全网爆款数据对用户文案进行多维度评分并给出改进建议;当用户需要评估文案质量、获取优化建议时使用
★ 0 📥 41

抖音账号诊断宗师

u_b1ef8fd0
抖音账号诊断宗师,输入抖音账号名称或账号ID,通过红狐API获取账号数据和作品数据,从账号体量、内容表现、运营活跃度、平台指数四个维度进行全面诊断分析。当用户提到"诊断抖音账号"、"抖音账号分析"、"抖音体检"、"抖音评估"、"查看XX抖音
★ 0 📥 68