← 返回
未分类 中文

Smart Scraper

AI-powered web scraper with intelligent structure recognition. Extracts lists, articles, and tables from any website with automatic type detection.
{ "answer": "具备智能结构识别的AI网页抓取工具。自动检测类型,从任意网站提取列表、文章和表格。" }
yadanzheng68-cmyk yadanzheng68-cmyk 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 449
下载
💾 1
安装
1
版本
#latest

概述

Smart Scraper

Intelligent web scraping that understands page structure.

Features

  • Auto-detection: Automatically identifies list, article, or table layouts
  • Smart extraction: Parses prices, dates, URLs from unstructured text
  • Multiple formats: Output as JSON, CSV, or Markdown
  • Scroll support: Handles infinite scroll pages

Usage

# Extract product listings
smart-scraper --url "https://example.com/products" --type list

# Extract article content
smart-scraper --url "https://example.com/article" --type article --format markdown

# Extract table data
smart-scraper --url "https://example.com/data" --type table --format csv

Options

OptionDescriptionDefault
------------------------------
--url, -uTarget URL (required)-
--type, -tExtraction type: list, article, table, autoauto
--format, -fOutput format: json, csv, markdownjson
--max, -mMaximum items to extract100
--scrollEnable auto-scroll for lazy-loaded contentfalse

Examples

Extract Hacker News

smart-scraper -u https://news.ycombinator.com -t list -m 10

Save article as Markdown

smart-scraper -u https://blog.example.com/post -t article -f markdown > article.md

Export table to CSV

smart-scraper -u https://example.com/prices -t table -f csv > prices.csv

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-30 22:02 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

Tavily 搜索

jacky1n7
通过 Tavily API 进行网页搜索(Brave 替代方案)。当用户要求搜索网页、查找来源或链接,且 Brave 网页搜索不可用时使用。
★ 273 📥 100,358
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 208 📥 68,653
data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 297 📥 140,781