您的智能资讯发现引擎 - 从海量信息源中智能筛选、深度分析,为您呈现最值得关注的内容。
# 标准模式:5分钟掌握今日要点
python3 modules/collector.py --mode essential
# 深度模式:获取更丰富内容
python3 modules/collector.py --mode comprehensive
# 科技前沿:AI、开发者工具、新技术
python3 modules/collector.py --domain tech --deep
# 商业财经:市场动态、行业分析
python3 modules/collector.py --domain business
# 持续追踪特定话题(保存配置)
python3 modules/collector.py --watch AI,LLM,大模型 --save-config my_ai_watch
# 加载已保存的追踪配置
python3 modules/collector.py --load-config my_ai_watch
# 生成定时任务配置
python3 modules/briefing_gen.py --generate-cron --time "09:00"
# 查看调度器配置说明
cat modules/scheduler.md
| 需求 | 命令 |
|---|---|
| ------ | ------ |
| ⚡ 快速概览 | --mode essential |
| 📊 全面扫描 | --mode comprehensive |
| 🤖 科技动态 | --domain tech |
| 💼 财经资讯 | --domain business |
| 🔥 热点捕捉 | --domain trending |
| 📰 深度阅读 | --deep |
| 🔍 关键词过滤 | --watch 关键词1,关键词2 |
| 💾 保存配置 | --save-config 名称 |
| 📂 加载配置 | --load-config 名称 |
| 🩺 信源自检 | --health-check |
| 📋 列出信源 | --list-feeds |
系统内置多种场景配置,每种配置自动选择最合适的信源组合:
| 场景 | 覆盖范围 | 适用人群 |
|---|---|---|
| ------ | ---------- | ---------- |
essential | 核心5源,快速响应 | 时间紧张的白领 |
comprehensive | 12+信源,深度覆盖 | 需要全面信息的分析师 |
tech | 科技、开发者、AI | 技术人员、创业者 |
business | 财经、创投、市场 | 投资人、管理者 |
trending | 社交热点、实时话题 | 关注舆情的运营 |
不仅仅是抓取,系统会:
python3 modules/collector.py --recommend --limit 5
保存您的专属配置,下次一键调用:
# 配置关注的关键词
python3 modules/collector.py --watch AI,芯片,云计算 --save-config my_work
# 以后直接加载
python3 modules/collector.py --load-config my_work
启动前检测所有信源可用性,智能规避故障源:
python3 modules/collector.py --health-check
输出示例:
🩺 信源自检报告
━━━━━━━━━━━━━━━━━━━━━━
✅ Hacker News 响应 0.3s
✅ GitHub Trending 响应 0.5s
⚠️ 微博热搜 响应超时 (跳过)
✅ 36氪快讯 响应 0.4s
✅ 掘金社区 响应 0.6s
━━━━━━━━━━━━━━━━━━━━━━
可用信源: 4/5 | 建议: 使用快速模式
| 标识 | 名称 | 类型 | 特点 |
|---|---|---|---|
| ------ | ------ | ------ | ------ |
hn | Hacker News | 社区聚合 | 全球科技风向标 |
gh | GitHub Trending | 项目趋势 | 开源项目热度 |
wb | 微博热搜 | 实时热点 | 国内话题引爆点 |
36k | 36氪快讯 | 科技媒体 | 创投圈第一时间 |
v2x | V2EX热帖 | 技术社区 | 开发者讨论 |
| 标识 | 名称 | 类型 | 特点 |
|---|---|---|---|
| ------ | ------ | ------ | ------ |
wsc | 华尔街见闻 | 财经 | 市场快讯 |
tx | 腾讯新闻 | 综合 | 国内要闻 |
ph | Product Hunt | 产品 | 新产品发布 |
hf | HuggingFace | 学术 | AI/ML论文 |
juejin | 掘金 | 技术社区 | 中文技术文章 |
ai_digest | AI文摘 | Newsletter | 专家观点精选 |
每条内容都会标注重要程度:
| 标识 | 含义 | 判断依据 |
|---|---|---|
| ------ | ------ | ---------- |
| 🔥 TOP | 今日焦点 | 热度极高或含重磅关键词 |
| ⭐ 推荐 | 值得关注 | 中等热度或专业相关 |
| 📌 参考 | 一般内容 | 普通话题,可快速浏览 |
{
"title": "内容标题",
"url": "原始链接",
"source": "来源名称",
"signal": "热度信号(如: ⭐1200, 💬89)",
"when": "发布时间",
"lang": "原文语言(zh/en)",
"level": "重要性标识"
}
| 参数 | 说明 | 示例 |
|---|---|---|
| ------ | ------ | ------ |
--mode | 场景模式 | essential, comprehensive |
--domain | 专业领域 | tech, business, trending |
--watch | 关键词追踪 | --watch AI,大模型 |
--deep | 深度抓取 | 获取文章摘要 |
--limit | 每源数量 | 默认8条 |
--save-config | 保存配置 | --save-config my_setup |
--load-config | 加载配置 | --load-config my_setup |
--health-check | 信源自检 | 仅检测不抓取 |
--list-feeds | 列出信源 | 显示所有可用源 |
--json | JSON输出 | 结构化数据 |
| 参数 | 说明 | 示例 |
|---|---|---|
| ------ | ------ | ------ |
--preset | 报告模板 | daily, weekly, trend |
--sources | 指定信源 | hn,gh,wb |
--title | 自定义标题 | --title 我的日报 |
--json | JSON格式 | 输出结构化数据 |
--generate-cron | 生成定时配置 | 创建crontab |
# 第一步:快速检测可用信源
python3 modules/collector.py --health-check
# 第二步:获取今日要点
python3 modules/collector.py --mode essential --limit 10 --no-save
# 第三步:深度阅读感兴趣的话题
python3 modules/collector.py --domain tech --watch AI --deep
# 第一步:全面扫描
python3 modules/collector.py --mode comprehensive --deep > scan_result.json
# 第二步:生成报告
python3 modules/briefing_gen.py --preset daily --sources hn,gh,36k,wsc --title "今日行业扫描"
# 第三步:追踪特定话题
python3 modules/collector.py --watch 芯片,半导体,光刻机 --save-config chip_watch
# 设置追踪配置(首次)
python3 modules/collector.py \
--domain tech \
--watch 竞品名,行业名,融资,发布 \
--save-config startup_radar
# 日常使用(直接加载)
python3 modules/collector.py --load-config startup_radar
# 安装依赖
pip install -r modules/deps.txt
# 验证安装
python3 modules/collector.py --list-feeds
环境要求: Python 3.8+,无需浏览器驱动
信息雷达/
├── SKILL.md # 使用文档
└── modules/
├── collector.py # 核心采集引擎
├── briefing_gen.py # 报告生成器
├── config.py # 信源配置表
├── parsers.py # 统一解析器
├── deps.txt # 依赖清单
├── health_check.md # 信源健康说明
└── scheduler.md # 定时任务配置
编辑 modules/config.py 中的 SOURCE_REGISTRY:
SOURCE_REGISTRY = {
"my_source": {
"name": "我的自定义源",
"url": "https://example.com/feed",
"parser": "rss", # html / json / rss
"domain": "tech", # tech / business / trending
"priority": 3, # 1-5, 越高越优先
"enabled": True,
}
}
# 编辑 crontab
crontab -e
# 每天早上9点运行
0 9 * * * cd /path/to/信息雷达 && python3 modules/collector.py --mode essential >> ~/radar.log 2>&1
详见 modules/scheduler.md
共 1 个版本