← 返回
未分类

ZDAT Crawl Skill

ZDAT零缺陷情报抓取技能。关键词监测+多平台情报采集+自动归档分类+负面预警。封装 smart-search-reader、crawl4ai-search、blogwatcher 进行定时抓取。
ZDAT 零缺陷情报抓取技能:关键词监测、多平台情报采集、自动归档分类与负面预警。使用 smart-search-reader、crawl4ai-search、blogwatcher 定时抓取。
freemanyg freemanyg 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 109
下载
💾 0
安装
1
版本
#crawl#keyword#latest#zdat

概述

🕷️ ZDAT 零缺陷情报抓取技能

身份定位

ZDAT博士军团情报中枢。定时全网抓取零缺陷相关情报,自动分类归档,触发预警。

触发关键词

抓取情报全网监控关键词监听舆情情报采集竞品监控

依赖技能

  • smart-search-reader — 元搜索引擎,聚合200+引擎搜索
  • crawl4ai-search — 全站深度抓取
  • blogwatcher — RSS/博客监控
  • cron — 定时执行
  • xlsx — 竞品台账写入

配置文件

  • skill_config/zd_keyword.yaml — 关键词词库
  • skill_config/zd_crawl_schedule.yaml — 抓取调度规则
  • skill_config/zd_publish_rule.yaml — 归档分类规则

执行流程

步骤1:关键词检索(多引擎并行)

# 多关键词并行搜索(按 keyword 类型分组)
python scripts/zd_crawl_search.py --type core
python scripts/zd_crawl_search.py --type industry
python scripts/zd_crawl_search.py --type intent

步骤2:内容判断与归档

命中关键词后:

  • 用户提问内容 → 输出标记为 【选题备用】
  • 行业落地案例 → 输出标记为 【工厂案例】
  • 竞品讲师发文 → 写入竞品台账Excel
  • 行业政策新规 → 输出标记为 【政策】

步骤3:负面预警检查

  • 统计负面关键词日出现次数
  • 单关键词单日≥15条 → 自动推送预警到企业微信
  • 头部行业博主大量发布 → 推送简报

步骤4:输出格式

📡 ZDAT抓取简报 YYYY-MM-DD HH:MM
━━━━━━━━━━━━━━━━━━━━━━
🟢 核心关键词:N条
  ├ 零缺陷:X条
  ├ PONC:Y条
  └ ...
🟡 行业拓展:N条
🔴 预警:N条
  ├ 负面关键词触发:XX
  └ 头部博主动态:XX

定时调度(通过 cron skill 注册)

| 时段 | 类型 | 范围 |

|:----|:----|:----|

| 08:00/14:00/20:00 | 全量抓取 | 所有关键词+全平台 |

| 02:00/08:00/14:00/20:00 | 增量巡检 | 小众论坛 |

示例命令

# 执行一次全量抓取
python active_skills/zdat-crawl-skill/scripts/zd_crawl_search.py --type all

# 仅抓取竞品监控
python active_skills/zdat-crawl-skill/scripts/zd_crawl_search.py --type competitor

# 检查预警
python active_skills/zdat-crawl-skill/scripts/zd_crawl_alert.py

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-06-06 07:06 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 297 📥 141,702
content-creation

ZDAT Publish Skill

freemanyg
ZDAT全平台发文技能:定时、格式转换、多平台一键分发、发布日志。封装 zdat-mpg-multi-publish 引擎,支持头条号、微信公众号、知乎、小红书、微博、抖音。
★ 0 📥 193
data-analysis

Tavily 搜索

jacky1n7
通过 Tavily API 进行网页搜索(Brave 替代方案)。当用户要求搜索网页、查找来源或链接,且 Brave 网页搜索不可用时使用。
★ 273 📥 100,726