← 返回
未分类

Safe Smart Web Fetch

安全网页抓取技能。获取网页内容时,默认先判断 URL 是否可能包含 token、是否为内网/本地域名、是否为私密链接;这三类一律不走第三方清洗服务,只走直接抓取。其余公开网页可按顺序尝试 Jina Reader、markdown.new、defuddle.md 获取干净 Markdown,失败再回退原始抓取。
安全网页抓取技能。先判断URL是否含token、内网/本地域名或私密链接,这些直接抓取;其余公开网页依次尝试Jina Reader、markdown.new、defuddle.md获取干净Markdown,失败回退原始抓取。
zqh2333 zqh2333 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 1
Stars
📥 466
下载
💾 0
安装
1
版本
#latest

概述

Safe Smart Web Fetch

用于安全地获取网页内容。

规则

先判断目标 URL:

一律禁止走第三方清洗的情况

  • URL query 或 fragment 中带明显 token / key / signature / auth / session / code 参数
  • localhost / 127.0.0.1 / 10.x / 172.16-31.x / 192.168.x / .local / 内网主机名
  • 明显私密页面:带登录态回调、管理后台、分享密钥、重置链接、单次授权链接等
  • 非 http/https URL

以上情况:

  • 只允许本地直接抓取
  • 不发送到 Jina / markdown.new / defuddle.md

可走第三方清洗的情况

  • 普通公开网页
  • 不含敏感 query 参数
  • 非内网/本地地址

第三方顺序:

  1. Jina Reader
  2. markdown.new
  3. defuddle.md
  4. 原始抓取回退

用法

python3 {baseDir}/scripts/fetch.py "https://example.com/article"
python3 {baseDir}/scripts/fetch.py "https://example.com/article" --json

输出

JSON 模式会返回:

  • success
  • url
  • content
  • source
  • used_third_party
  • blocked_reason
  • error

注意

  • 这是公开网页优先清洗、敏感链接严格本地抓取的安全版本
  • 不修改 OpenClaw 全局工具配置
  • 不强制禁用内置 web_fetch

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 04:23 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

ai-agent

Shared Memory Os

zqh2333
共享内存治理,支持多代理 OpenClaw 工作空间——包括分层内存、学习捕获、晋升审查、生命周期管理、自我维护等功能
★ 1 📥 576
data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 297 📥 141,757
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 211 📥 69,747