```
requests==2.31.0
feedparser==6.0.10
beautifulsoup4==4.12.2
lxml==4.9.3
```
sources.json 配置文件scripts/collect_feeds.py 读取配置并获取文章列表```bash
python /workspace/projects/daily-news-collector/scripts/collect_feeds.py --config ./sources.json --output ./raw_data.json
```
scripts/collect_webpages.py 获取网页内容```bash
python /workspace/projects/daily-news-collector/scripts/collect_webpages.py --url
```
collect_feeds.py.),便于用户访问# 1. 配置RSS源(如36氪、TechCrunch等)
# 2. 收集数据
python /workspace/projects/daily-news-collector/scripts/collect_feeds.py --config ./tech_sources.json --output ./tech_news.json
# 3. 智能体分析并生成科技日报(由智能体完成)
# - 筛选科技类资讯
# - 生成分类摘要
# - 输出:daily-tech-report-2024-01-15.md
# 1. 配置竞品官网和新闻源
# 2. 收集网页内容
python /workspace/projects/daily-news-collector/scripts/collect_webpages.py --url https://competitor.com/news --output ./competitor_news.json
# 3. 智能体分析竞品动态(由智能体完成)
# - 提取关键信息(产品发布、融资、合作等)
# - 生成竞品监控报告
# 1. 从多个源收集数据(RSS + 网页)
python /workspace/projects/daily-news-collector/scripts/collect_feeds.py --config ./all_sources.json --output ./all_news.json
# 2. 智能体生成综合日报(由智能体完成)
# - 按主题分类
# - 生成每日摘要
# - 输出:daily-report-2024-01-15.md
共 1 个版本