← 返回
未分类

daily-news-collector

每天从多个媒体渠道(RSS源、网站、API)自动收集最新资讯,智能分析并生成结构化日报。适用于需要定期监控行业动态、新闻资讯、竞品信息等场景。
每日自动采集多渠道资讯(RSS/网站/API),智能分析生成结构化日报,支持行业动态、新闻竞品监控。
winsaney winsaney 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 1
Stars
📥 365
下载
💾 1
安装
1
版本
#latest

概述

每日资讯收集助手

任务目标

  • 本 Skill 用于:每天自动从多个媒体渠道收集最新资讯并生成结构化日报
  • 能力包含:
  • 支持RSS订阅源、网页抓取等多种数据源
  • 自动解析和格式化原始数据
  • 智能筛选重要资讯并分类整理
  • 生成可读性强的Markdown格式日报
  • 触发条件:用户需要"收集资讯"、"生成日报"、"监控媒体动态"等场景

前置准备

  • 依赖说明:

```

requests==2.31.0

feedparser==6.0.10

beautifulsoup4==4.12.2

lxml==4.9.3

```

操作步骤

标准流程

  1. 收集原始数据
    • 从RSS源收集:调用 scripts/collect_feeds.py 读取配置并获取文章列表

```bash

python /workspace/projects/daily-news-collector/scripts/collect_feeds.py --config ./sources.json --output ./raw_data.json

```

  • 从网页抓取:调用 scripts/collect_webpages.py 获取网页内容

```bash

python /workspace/projects/daily-news-collector/scripts/collect_webpages.py --url --output ./webpage_data.json

```

  • 合并数据到统一的JSON文件供后续分析
  1. 分析筛选资讯
    • 智能体读取收集到的原始数据
    • 根据用户需求筛选重要资讯(如:科技类、商业类、特定关键词)
    • 按主题自动分类(科技、商业、社会、政策等)
    • 为每条资讯生成简明摘要(1-2句话)
  1. 生成日报
    • 参照 assets/template.md 的格式
    • 按分类组织内容,包含标题、链接、摘要、来源
    • 添加日期、统计数据(总条数、分类分布)
    • 输出为Markdown格式的日报文件

可选分支

  • 当只需要RSS数据:仅执行 collect_feeds.py
  • 当需要增量更新:检查历史数据,只收集新发布的内容
  • 当需要定制分类:在分析阶段根据用户指定的分类规则

资源索引

注意事项

  • 脚本负责数据获取和格式化,智能体负责内容分析和总结
  • 定期更新媒体源配置以保持数据新鲜度
  • 遵守目标网站的robots.txt规则,合理设置抓取频率
  • 生成的日报保存在当前工作目录(.),便于用户访问

使用示例

示例1:收集科技媒体资讯

# 1. 配置RSS源(如36氪、TechCrunch等)
# 2. 收集数据
python /workspace/projects/daily-news-collector/scripts/collect_feeds.py --config ./tech_sources.json --output ./tech_news.json

# 3. 智能体分析并生成科技日报(由智能体完成)
# - 筛选科技类资讯
# - 生成分类摘要
# - 输出:daily-tech-report-2024-01-15.md

示例2:监控竞品动态

# 1. 配置竞品官网和新闻源
# 2. 收集网页内容
python /workspace/projects/daily-news-collector/scripts/collect_webpages.py --url https://competitor.com/news --output ./competitor_news.json

# 3. 智能体分析竞品动态(由智能体完成)
# - 提取关键信息(产品发布、融资、合作等)
# - 生成竞品监控报告

示例3:综合日报

# 1. 从多个源收集数据(RSS + 网页)
python /workspace/projects/daily-news-collector/scripts/collect_feeds.py --config ./all_sources.json --output ./all_news.json

# 2. 智能体生成综合日报(由智能体完成)
# - 按主题分类
# - 生成每日摘要
# - 输出:daily-report-2024-01-15.md

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 08:04 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

ai-agent

Find Skills

guipi888
场景驱动+关键词双模式技能发现工具。当用户用自然语言描述场景/需求(如"我想做一个海报""帮我分析股票"),或明确说"安装技能/find skills/找个skill"时,自动从官方内置、本地已安装、SkillHub、虾评、GitHub、C
★ 1,460 📥 518,002
ai-agent

self-improving agent

pskoett
捕获经验教训、错误及修正内容,以实现持续改进。适用于以下场景:(1)命令或操作意外失败;(2)用户纠正Claude(如“不,那不对……”“实际上……”);(3)用户请求的功能不存在;(4)外部API或工具出现故障;(5)Claude发现自身
★ 4,099 📥 825,919
data-analysis

data-analysis-init

winsaney
为 PMO Agent 初始化数据分析计划,支持飞书表格/本地文件,结合网络搜索生成标准化报告。
★ 0 📥 474