← 返回
未分类

Scrapling Safe

Scrapling 安全技能 - 网页数据抓取工具 支持 HTTP 请求、隐身抓取、浏览器自动化 智能元素定位,抗反爬虫检测 无需 API 配置,路径输出受限
Scrapling 安全技能 - 网页数据抓取工具 支持 HTTP 请求、隐身抓取、浏览器自动化 智能元素定位,抗反爬虫检测 无需 API 配置,路径输出受限
linshuikeji
未分类 clawhub v1.0.0 1 版本 99838.4 Key: 无需
★ 0
Stars
📥 618
下载
💾 64
安装
1
版本
#latest

概述

Scrapling 技能

使用 Scrapling 框架进行安全的网页数据抓取和内容提取。

安全说明

仅用于合法用途,严格遵守以下限制:

  • 仅抓取公开网站:遵守 robots.txt 和网站服务条款
  • 路径输出受限:结果文件只能保存到用户主目录
  • 无危险函数:不使用 eval/exec 等危险函数
  • 严格的超时控制:防止无限等待
  • 频率限制:自动添加请求延迟,避免对目标造成压力
  • 禁止抓取私有内容:仅抓取公开可访问页面
  • 禁止大规模爬取:默认并发限制为 1

核心功能

  • 🕷️ 多种抓取模式:HTTP/隐身/浏览器自动化
  • 🎯 智能元素定位:自适应选择器,网站改版后仍有效
  • 📄 数据提取:CSS/XPath/文本/正则搜索
  • 💾 结果保存:保存到 JSON/TXT/MD 文件(路径受限)
  • 🔍 内容解析:类似 Scrapy 的 API,易于使用

使用场景

  • 抓取公开新闻和资讯
  • 提取商品信息(电商网站)
  • 收集公开数据(天气、股票等)
  • 网站内容监控

触发词

  • "scrapling 抓取..."
  • "scrapling 提取..."
  • "scrapling 爬取..."
  • "scrapling 获取..."

快速开始

基本抓取

# HTTP 请求抓取
scrapling get 'https://example.com' --output ~/result.json

# 隐身模式抓取
scrapling stealthy 'https://example.com' --output ~/result.json

# 浏览器自动化(动态内容)
scrapling dynamic 'https://example.com' --output ~/result.json

指定选择器

# 使用 CSS 选择器
scrapling get 'https://quotes.toscrape.com' --css-selector '.quote' --output ~/quotes.json

# 提取特定字段
scrapling get 'https://quotes.toscrape.com' --css-selector '.quote .text' --output ~/text.txt

高级用法

# 隐身模式 + 解决 Cloudflare
scrapling stealthy 'https://nopecha.com/demo/cloudflare' --solve-cloudflare --output ~/result.json

# 并发抓取(限制为 1)
scrapling spider 'https://example.com' --concurrent 1 --output ~/crawl.json

安装要求

  • Python 3.10+
  • 需要安装 Scrapling: pip install scrapling[fetchers]
  • 需要浏览器依赖:scrapling install

注意事项

  • 需要本地安装 Scrapling 和相关依赖
  • 默认请求延迟 1 秒,避免对目标造成压力
  • 仅抓取公开可访问的页面
  • 遵守 robots.txt 和网站服务条款
  • 输出文件路径必须在用户主目录

版本历史

  • 1.0.0 - 初始版本

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-30 18:58 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

AI Agent Skills Manager - 智能体技能管理工具

linshuikeji
AI智能体技能管理器,用于安装和管理OpenClaw技能包,提供交互式选择界面。适用场景:(1)用户需要安装AI智能体技能时;(2)用户需要管理OpenClaw技能时。
★ 0 📥 612
productivity

Browser Search

linshuikeji
浏览器搜索技能 - 安全的网页搜索工具 使用本地浏览器进行自动化搜索和内容提取 支持 Bing、Google、Baidu、DuckDuckGo 等公开搜索引擎 无需 API 配置,路径输出受限
★ 0 📥 1,154
productivity

Session History Retriever Clean

linshuikeji
查看历史会话记录并引用导入到本地对话。使用 sessions_list、sessions_history 和 sessions_send 工具管理会话历史。适用于:(1) 查找过往对话,(2) 回顾工作进度,(3) 导入历史上下文到当前会话
★ 0 📥 550