← 返回
未分类

网页内容提取小助手

从网页URL中提取标题、正文、图片链接等内容
从网页URL提取标题、正文和图片链接
shuishouxinboda shuishouxinboda 来源
未分类 clawhub v1.0.3 1 版本 99794.7 Key: 无需
★ 1
Stars
📥 466
下载
💾 0
安装
1
版本
#latest

概述

网页内容提取器

这是一个实用的网页内容提取技能,可以从任意网页中提取结构化信息。

功能特点

  • 自动提取网页标题和元数据
  • 提取正文内容并清理HTML标签
  • 提取所有图片链接
  • 提取所有外链
  • 支持指定提取元素
  • 输出格式化JSON结果

使用方法

基本用法

技能输入:https://example.com
技能输出:{"title": "...", "content": "...", "images": [...], "links": [...]}

高级用法

  • 指定提取特定元素
  • 设置内容长度限制
  • 自定义输出格式

技术规格

  • 编程语言:Python 3
  • 依赖库:requests, beautifulsoup4
  • 网络要求:需要互联网连接

版本历史

共 1 个版本

  • v1.0.3 当前
    2026-05-03 10:54 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

Tavily 搜索

jacky1n7
通过 Tavily API 进行网页搜索(Brave 替代方案)。当用户要求搜索网页、查找来源或链接,且 Brave 网页搜索不可用时使用。
★ 273 📥 100,221
data-analysis

Stock Watcher

robin797860
管理和监控个人股票自选列表,支持利用同花顺数据添加、删除、列出股票及汇总近期表现。适用于用户希望追踪特定股票、获取表现汇总或管理自选列表时。
★ 112 📥 46,052
data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 296 📥 139,661