← 返回
未分类

Journal Deep Intel Extractor

专业的学术情报提取工具。支持 Nature/Science/Cell 等全球主流期刊,自动化抓取过去 N 天内新增的 Article 或 Review,并深度提取 PMID 与 Abstract 全文,为 AI 科普总结提供核心数据源。
专业的学术情报提取工具。支持《自然》《科学》《细胞》等全球主流期刊,自动抓取过去 N 天内新增的 Article 或 Review,并深度提取 PMID 与摘要全文,为 AI 科普总结提供核心数据源。
chenghan66
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 351
下载
💾 0
安装
1
版本
#latest

概述

🎓 Journal Deep Intel Intelligence Station

这是一个为医学与生命科学科研人员定制的自动化情报工具。它解决了“只看标题不了解实质内容”的痛点,通过模拟深度访问,为每一篇新文献建立完整的摘要档案。

🌟 核心功能

  • 深度抓取:不同于常规爬虫,本工具会逐一进入 PubMed 详情页提取 Abstract (摘要)
  • 精准过滤:利用 PubMed 官方 Publication Type 标签,自动剔除新闻、社论和简报,只留硬核干货。
  • 时间窗口监控:基于 [pdat] 逻辑,支持按周或按月生成定制化文献简报。
  • AI 友好型输出:生成结构化的 JSON 数据,完美适配 OpenClaw 内部的 LLM 总结流程。

🛠️ 技术实现

  1. 引擎:基于 Python 3.x 配合 BeautifulSoup4 处理 HTML 解析。
  2. 频率控制:内置 0.5s 的抓取延迟(Rate Limiting),保护您的 IP 不被 PubMed 临时封禁。
  3. 本地归档:数据自动保存至 ~/Documents/Journal_Intel/ 目录下,按日期和期刊名分类存储。

📖 使用场景示例

  • 场景一:Nature 周报

参数:journal="Nature", type="Article", days=7

  • 场景二:顶级综述追踪

参数:journal="Science", type="Review", days=30

⚠️ 运行提示

由于需要进行深度详情页抓取,运行速度约为 1秒/篇。若当周更新较多(如超过 50 篇),请耐心等待脚本运行结束。

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 13:30 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

dev-programming

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 675 📥 325,191
ai-agent

self-improving agent

pskoett
捕获经验教训、错误及修正内容,以实现持续改进。适用于以下场景:(1)命令或操作意外失败;(2)用户纠正Claude(如“不,那不对……”“实际上……”);(3)用户请求的功能不存在;(4)外部API或工具出现故障;(5)Claude发现自身
★ 4,078 📥 808,054
ai-agent

Self-Improving + Proactive Agent

ivangdavila
自我反思+自我批评+自我学习+自组织记忆。智能体评估自身工作、发现错误并持续改进。
★ 1,376 📥 320,101