← 返回
未分类

Web Extractor

使用 jina.ai 提取网页干净文本并让 Agent 总结。触发词:提取网页、总结新闻、提取文章、获取页面内容
使用 jina.ai 提取网页干净文本并让 Agent 总结。触发词:提取网页、总结新闻、提取文章、获取页面内容
kukuxnd kukuxnd 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 1
Stars
📥 646
下载
💾 1
安装
1
版本
#latest

概述

网页内容提取技能

使用 r.jina.ai 提取网页干净文本,过滤垃圾代码,提取干货内容。

工作流程

1. 提取网页内容

# 提取网页并保存为 md 文件
curl -s https://r.jina.ai/<URL> > /tmp/web-content.md

2. 读取并总结

让 Agent 读取生成的 md 文件,总结核心观点。

使用示例

用户说:"帮我总结这个新闻 https://www.bbc.com/news/tech..."

执行:

curl -s "https://r.jina.ai/https://www.bbc.com/news/technology-xxx" > /tmp/news.md

然后读取 /tmp/news.md 文件内容,分析并总结。

注意事项

  • r.jina.ai 会过滤掉 script、nav、广告 CSS 等垃圾代码
  • 提取后是极干净的纯文本,对 AI 零负担
  • 支持任何新闻网站、技术博客、文章页面
  • 文件默认保存到 /tmp/ 目录,可自定义路径

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-03 04:24 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 296 📥 138,977
life-service

Kuuila Game

kukuxnd
通用互动游戏框架,支持单人文字冒险、猜谜及多人武侠游戏,含私聊控制群游戏和实时状态同步。
★ 0 📥 884
data-analysis

Tavily 搜索

jacky1n7
通过 Tavily API 进行网页搜索(Brave 替代方案)。当用户要求搜索网页、查找来源或链接,且 Brave 网页搜索不可用时使用。
★ 272 📥 100,100