← 返回
未分类
zt-web-fetcher
当需要获取网页内容时使用(搜索结果页面、博客文章、文档等)。使用 URL 转 Markdown 服务将网页转换为可读文本。 触发场景:用户说"帮我查一下"、"看看这个链接"、"获取 xx 的信息"等需要上网抓信息的情况。
当需要获取网页内容时使用(搜索结果页面、博客文章、文档等)。使用 URL 转 Markdown 服务将网页转换为可读文本。 触发场景:用户说"帮我查一下"、"看看这个链接"、"获取 xx 的信息"等需要上网抓信息的情况。
未分类
clawhub
v1.0.0 1 版本 99888.5 Key: 无需
#fetch#latest#markdown#scraper#web
概述
网页抓取
当需要获取网页内容时,按以下顺序尝试:
首选方案:URL 转 Markdown 服务
- markdown.new/ (推荐)
- 用法:在网址前加
https://markdown.new/ - 例如:
https://markdown.new/https://example.com - 适合 Cloudflare 支持的网站
- r.jina.ai/ (备用)
- 用法:在网址前加
https://r.jina.ai/ - 例如:
https://r.jina.ai/https://example.com - 兼容性好
- defuddle.md/ (备用)
- 用法:在网址前加
https://defuddle.md/ - 例如:
https://defuddle.md/https://example.com
备选方案:爬虫工具
如果以上服务都无法获取,尝试 Scrapling:
- 地址:https://github.com/D4Vinci/Scrapling
- 用法:
pip install scrapling 后使用
使用流程
- 先尝试
r.jina.ai/{url} (最稳定) - 如果失败,尝试
markdown.new/{url} - 再失败,尝试
defuddle.md/{url} - 都失败再考虑 Scrapling
注意事项
- 不需要配置任何搜索 API
- 这些服务会将网页转换为纯文本/ Markdown 格式
- 适合大多数静态网页
- 对于需要登录的页面可能无效
版本历史
共 1 个版本
-
v1.0.0
当前
2026-03-31 15:59 安全 安全
安全检测
腾讯云安全 (Sanbu)
安全,无风险
查看报告
🔗 相关推荐
data-analysis
robin797860
管理和监控个人股票自选列表,支持利用同花顺数据添加、删除、列出股票及汇总近期表现。适用于用户希望追踪特定股票、获取表现汇总或管理自选列表时。
★ 112
📥 46,300
data-analysis
ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 210
📥 68,834
data-analysis
fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 297
📥 141,036