← 返回
未分类

每日新闻日报 v2.3

每日新闻自动采集与报告生成。双引擎交叉验证 + 官方媒体优先 + 900秒超时容错。v2.3 稳定运行版(2026-06-01)。
每日新闻自动采集与报告生成;双引擎交叉验证、官方媒体优先、900秒超时容错;v2.3 稳定运行版(2026-06-01)
paudyyin paudyyin 来源
未分类 clawhub v2.3.0 2 版本 100000 Key: 无需
★ 0
Stars
📥 296
下载
💾 0
安装
2
版本
#latest

概述

每日新闻自动采集 v2.3

⚠️ 核心规则(必须严格执行)

规则1:双引擎交叉比对

每类新闻先用 web_search(channel="bocha") 搜一轮,合并结果后,对含具体数字(涨幅/产量/金额/GDP 等)的条目,再用 web_search(channel="baidu") 做二次验证。

总搜索量约 12-14 次(8 次基础 + 4-6 次验证),确保在超时范围内完成。

规则2:官方媒体优先

  • 🔴 首选来源:新华社、央视新闻、人民日报、中新网、中证网、环球网、参考消息、外交部官网、国防部官网等
  • 🟡 次选来源:财联社、证券时报、上海证券报、中国证券报、第一财经、经济观察报等专业财经媒体
  • 慎用来源:股吧、财富号、自媒体博客、论坛帖子、经销商网站(仅作参考,不可作为主要数据依据)
  • 每条新闻必须标注来源和可信度等级(🔴/🟡/⚪)
  • 含具体数字的新闻,必须双引擎验证通过才算可信,否则标注"⚠️ 单一来源"

规则3:完整内容推送到聊天

  • 报告生成后,将完整报告内容直接作为输出返回,不要只返回摘要或文件路径
  • 同时在 memory/daily_news_YYYY-MM-DD.md 保存完整副本

架构变更历史

v2.3(2026-06-01)— 当前稳定版

  • ✅ 双引擎策略:先 bocha 全量搜 → 再 baidu 验证含数据的条目(非每类都双搜)
  • ✅ timeout 900 秒(实测 332 秒完成,余量充足)
  • ✅ 每类 6-10 条(原 8-12,减少总量)
  • ✅ 官方媒体优先级强制规则
  • ✅ v2.2 连续超时问题彻底解决

v2.2(2026-05-29)

  • ✅ 对话输出规则:必须完整输出 8 类编号列表,禁止速览/缩略版
  • ❌ 16 次搜索 + 480/720 秒超时 → 连续超时

v2.1(2026-05-27)

  • ✅ 格式硬约束:强制编号列表、来源标注、可信度标记

v2.0(2026-05-21)

  • ✅ 改用 web_search(freshness=oneDay),废弃 Bing/Tavily 方案

v1.0(2026-04-21)— 已废弃

  • ❌ Bing 爬虫 + Tavily API,无法可靠过滤旧闻

执行流程

步骤 1: 确定日期

计算昨日日期 YYYY-MM-DD。

步骤 2: 8 大类搜索(bocha 基础搜索)

依次调用 web_search(channel="bocha", count=10)

#Emoji类别搜索关键词
---------------------------
1🌍全球政治军事全球 国际 政治 军事 外交 最新动态
2🇨🇳中国政治军事中国 国务院 政策 改革 外交 国防
3💰全球财经股市美股 道琼斯 纳斯达克 标普 原油 黄金 收盘 最新
4📈中国财经股市A股 沪指 深成指 创业板 板块 资金流
5🤖AI/人工智能AI 人工智能 大模型 芯片 算力 最新
6🔭科技领域量子计算 半导体 航天 卫星 6G 固态电池
7📱消费电子苹果 三星 手机 AR VR 面板 存储芯片
8🏠白色家电白色家电 冰箱 洗衣机 空调 美的 海尔 格力

步骤 3: baidu 二次验证

含具体数字(涨幅/产量/金额/GDP/温度等)的条目,用 web_search(channel="baidu") 做验证搜索。总验证次数控制在 4-6 次。

步骤 4: 内容筛选与清洗

排除规则:

  • ❌ 排除娱乐/体育/游戏/电竞内容
  • ❌ 排除往年旧闻(描述中出现 2025年、2024年等往年日期)
  • ❌ 排除网页噪声

保留规则:

  • ✅ 优先权威媒体源
  • ✅ 保留包含具体数据、人物、事件的条目
  • ✅ 跨类别去重

步骤 5: 生成报告(严格遵循格式)

格式铁律

  1. 每条新闻必须独立成行,使用 1. 2. 3. 编号,禁止用分号/逗号拼接成一段
  2. 每条必须标注来源和可信度,格式:| 媒体名 🔴/🟡/⚪
  3. 固定 8 个类别,不得增删合并
  4. 每条结构标题 — 一句话摘要。| 来源 🔴/🟡/⚪
  5. 每个类别 6-10 条

可信度标记

标记含义来源举例
---------------------
🔴官方确认新华社、央视、政府官网、公司官网/公告
🟡专业媒体36氪、界面、财新、证券时报、IT之家
第三方整合(仅作参考)论坛、博客、自媒体

报告模板

# 📰 每日新闻日报 v2.3 — {日期}
> 数据源:web_search(bocha) + web_search(baidu) 交叉验证

## 📌 今日一句话总结
**[用一句话概括当天最重要的 2-3 条新闻,40 字以内]**

---

## 🌍 一、全球政治军事(6-10条)

1. **新闻标题** — 一句话摘要。| 来源 🔴/🟡/⚪
...

## 🇨🇳 二、中国政治军事(6-10条)
## 💰 三、全球财经股市(6-10条)
## 📈 四、中国财经股市(6-10条)
## 🤖 五、AI 人工智能(6-10条)
## 🔭 六、科技领域(6-10条)
## 📱 七、消费电子(6-10条)
## 🏠 八、白色家电(6-10条)

---

*可信度等级:🔴官方确认 | 🟡专业媒体 | ⚪第三方整合*

步骤 6: 保存 + 推送

  1. 保存到 memory/daily_news_{YYYY-MM-DD}.md
  2. 将完整报告内容直接作为本次任务的回复输出

Cron 任务配置参考

{
  "name": "每日新闻日报 (v2.3)",
  "schedule": { "kind": "cron", "expr": "30 8 * * 1-5", "tz": "Asia/Shanghai" },
  "payload": {
    "kind": "agentTurn",
    "message": "按 skills/daily-news/SKILL.md 执行每日新闻日报 v2.3"
  },
  "timeoutSeconds": 900
}

相关文件

文件状态说明
------------------
skills/daily-news/SKILL.md✅ 当前本技能文档
daily_news_query.py⚠️ 已废弃旧版 Bing 爬虫方案
daily_news_tavily.py⚠️ 已废弃旧版 Tavily API 方案
memory/daily_news_*.md✅ 历史存档每日报告存档

版本历史

共 2 个版本

  • v2.3.0 当前
    2026-06-01 21:19
  • v2.1.0
    2026-05-28 13:41

安全检测

腾讯云安全 (Keen)

队列中

腾讯云安全 (Sanbu)

队列中

🔗 相关推荐

data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 298 📥 143,017
data-analysis

Tavily 搜索

jacky1n7
通过 Tavily API 进行网页搜索(Brave 替代方案)。当用户要求搜索网页、查找来源或链接,且 Brave 网页搜索不可用时使用。
★ 278 📥 101,587
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 216 📥 71,577