← 返回
未分类

Playwright Scraper

使用 Playwright + Stealth 插件绕过反爬机制抓取页面。
使用 Playwright+Stealth 插件绕过反爬抓取页面
sdt328606
未分类 clawhub v2.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 157
下载
💾 0
安装
1
版本
#latest

概述

Playwright Stealth Scraper 🕷️

web_fetch 工具拿不到目标页面内容时(403、JS渲染、反爬),用这个技能。

前置条件

需要本地安装了 Playwright 和 Chromium。

# 在技能目录下安装
cd ~/.openclaw/workspace/skills/playwright-scraper
npm install playwright puppeteer-extra-plugin-stealth
npx playwright install chromium

注意:这会下载约 300MB 的 Chromium 二进制文件。

什么时候用这个

场景用什么
--------------
普通网页、API 返回web_fetch(内置,轻量)
被 Cloudflare 等反爬拦截playwright-scraper
页面需要 JS 渲染才能显示内容playwright-scraper
需要登录后抓取playwright-scraper + 手动处理 cookie

使用方式

方式一:写一个独立脚本(推荐)

const { chromium } = require('playwright-extra');
const stealth = require('puppeteer-extra-plugin-stealth')();
chromium.use(stealth);

(async () => {
  const browser = await chromium.launch({ headless: true });
  const page = await browser.newPage();
  await page.goto('目标URL', { waitUntil: 'networkidle' });
  const content = await page.content();
  // 提取你需要的内容
  console.log(content);
  await browser.close();
})();

方式二:直接用 OpenClaw 的 browser 工具

# 启动浏览器
browser action=start profile=openclaw
# 打开页面
browser action=open url=目标URL
# 获取快照
browser action=snapshot targetId=XXX

内置 browser 工具通常够用,playwright-scraper 主要应对特殊反爬场景。

注意

  • 不要高频爬取,尊重 robots.txt
  • 如果目标网站有登录墙,不要自动填凭据,请示老板
  • 爬下来的数据存到工作区对应目录,不要丢在 /tmp

版本历史

共 1 个版本

  • v2.0.0 当前
    2026-06-03 13:33

安全检测

腾讯云安全 (Keen)

队列中

腾讯云安全 (Sanbu)

队列中

🔗 相关推荐

Jimeng Video Generator

sdt328606
即梦AI视频生成3.0 1080P。通过火山引擎即梦AI API生成视频(图生视频-首尾帧模式)。 触发词:即梦、极梦、视频生成、图生视频、首尾帧、火山引擎视频
★ 0 📥 185

Session Sync

sdt328606
跨会话记忆同步协议,确保在飞书、WebChat及其他渠道的记忆一致性。
★ 0 📥 208

Deep Research

sdt328606
结构化深度研究框架,包含明确的反馈循环和心智模型演进。灵感来源于VeriTrace和智能体系统扩展相关论文。
★ 0 📥 230