← 返回
未分类

NEP论文情报官

定时从 NEP 系列网站抓取学术论文,生成中文摘要,推送飞书,支持关键词过滤、评分排序和下载存档。适用于研究人员追踪最新学术动态。
胖虎
未分类 community v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 115
下载
💾 0
安装
1
版本
#latest

概述

NEP-Watcher:论文情报员

定时从指定学术网站抓取论文,生成中文摘要,推送飞书,支持关键词过滤、评分排序、下载存档。

功能一览

功能说明
------------
定时抓取每天自动执行,无需手动
多网站支持NEP系列(公共经济学、会计、劳动经济学等)+ 自定义URL
关键词过滤只推送包含指定关键词的论文
评分排序按关键词匹配度 + 时间综合评分
中文摘要MyMemory API 翻译,标题摘要均支持
飞书推送卡片式推送,支持直接下载
下载存档回复"下载X"即可存档到本地

首次初始化

/nep-watcher init

会引导设置:

  1. 选择论文领域或自定义URL
  2. 设置每次推送篇数(默认5篇)
  3. 设置关键词(选填)
  4. 选择评分偏好

日常使用

/nep-watcher run        # 立即执行一次
/nep-watcher status     # 查看当前配置
/nep-watcher modify     # 调整关键词/偏好
/nep-watcher pause     # 暂停推送
/nep-watcher resume    # 恢复推送

交互命令

收到推送后:

  • 下载1 / download 1 → 下载第1篇
  • 下载1,3,5 → 同时下载第1、3、5篇
  • 跳过 → 忽略本次推送

定时调度

通过 OpenClaw cron job 实现,调度命令:

openclaw cron create \
  --name "NEP-PBE论文推送" \
  --schedule "0 8 * * *" \
  --command "python3 ~/.openclaw/workspace/skills/nep-watcher/scripts/main.py"

依赖

  • Python 3.9+
  • requests / beautifulsoup4
  • lark-cli(飞书推送)
  • OpenClaw cron 调度

目录结构

nep-watcher/
├── SKILL.md
├── config.json
├── scripts/
│   ├── main.py          # 主入口
│   ├── fetcher.py       # 网页抓取
│   ├── scorer.py        # 评分排序
│   ├── summarizer.py    # 摘要处理
│   ├── translator.py     # 翻译(MyMemory API)
│   ├── feishu_sender.py # 飞书推送
│   ├── downloader.py     # 下载存档
│   └── interactive.py    # 交互解析
└── templates/
    └── paper_card.md    # 消息卡片模板

配置说明

编辑 config.json 来自定义:

{
  "user_profile": {
    "field": "nep-pbe",
    "max_results": 5,
    "keywords": ["tax compliance", "BEPS"],
    "scoring": "hybrid",
    "hybrid_weights": {
      "keyword_match": 0.6,
      "recency": 0.4
    }
  },
  "schedule": {
    "cron": "0 20 * * *",
    "enabled": true
  },
  "feishu": {
    "chat_id": "用户open_id",
    "mention": true
  }
}

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-04-09 21:02 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

Tavily 搜索

jacky1n7
通过 Tavily API 进行网页搜索(Brave 替代方案)。当用户要求搜索网页、查找来源或链接,且 Brave 网页搜索不可用时使用。
★ 276 📥 101,298
data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 297 📥 142,587
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 214 📥 71,081