使用 Scrapling 框架进行安全的网页数据抓取和内容提取。
仅用于合法用途,严格遵守以下限制:
# HTTP 请求抓取
scrapling get 'https://example.com' --output ~/result.json
# 隐身模式抓取
scrapling stealthy 'https://example.com' --output ~/result.json
# 浏览器自动化(动态内容)
scrapling dynamic 'https://example.com' --output ~/result.json
# 使用 CSS 选择器
scrapling get 'https://quotes.toscrape.com' --css-selector '.quote' --output ~/quotes.json
# 提取特定字段
scrapling get 'https://quotes.toscrape.com' --css-selector '.quote .text' --output ~/text.txt
# 隐身模式 + 解决 Cloudflare
scrapling stealthy 'https://nopecha.com/demo/cloudflare' --solve-cloudflare --output ~/result.json
# 并发抓取(限制为 1)
scrapling spider 'https://example.com' --concurrent 1 --output ~/crawl.json
pip install scrapling[fetchers]scrapling install共 1 个版本