← 返回
未分类

Amber Url To Markdown

智能 URL 转 Markdown 工具(V4.0 可扩展架构)。**支持自动触发 Hook**,当用户发送 URL 链接时自动抓取内容并转换为 Markdown 格式。采用可扩展的分类处理架构,支持豆包、微信公众号、知乎、掘金等网站。
智能URL 转 Markdown 工具(V4.0 可扩展架构),支持自动触发 Hook,用户发送链接时自动抓取并转为 Markdown,采用可扩展分类处理,支持豆包、微信公众号、知乎、掘金等平台。
lsa03 lsa03 来源
未分类 clawhub v4.0.3 1 版本 100000 Key: 无需
★ 1
Stars
📥 495
下载
💾 1
安装
1
版本
#latest

概述

Amber Url to Markdown

智能 URL 转 Markdown 工具,支持微信公众号、知乎、掘金、CSDN、GitHub、Medium 等 7+ 网站类型。

🚀 自动触发(V3.1 新增)

安装技能后,启用 Hook 即可实现真正的自动触发!

启用自动触发 Hook

# 1. 查看可用 Hook
openclaw hooks list

# 2. 启用 url-auto-fetch Hook
openclaw hooks enable url-auto-fetch

# 3. 检查 Hook 状态
openclaw hooks check

启用后,当用户发送以下消息时会自动抓取:

  1. 纯 URL 消息

```

https://mp.weixin.qq.com/s/xxx

```

  1. URL + 意图关键词

```

帮我把这篇文章转成 Markdown:https://mp.weixin.qq.com/s/xxx

解析这个链接:https://zhuanlan.zhihu.com/p/xxx

```

Hook 工作原理

  • 监听 message:received 事件
  • 自动检测消息中的 URL 链接
  • 判断是否为纯 URL 或包含意图关键词
  • 自动调用 amber_url_to_markdown.py 脚本
  • 异步执行,不阻塞消息处理

🎯 手动触发(AI 调用)

如果未启用 Hook,AI 会在检测到以下条件时主动调用此技能:

  1. 纯 URL 消息 - 用户只发送了一个 URL 链接

```

https://mp.weixin.qq.com/s/xxx

```

  1. URL + 意图关键词 - 消息包含 URL 且有以下关键词:
    • 解析、转换、转成、转为、生成、抓取、爬取、下载
    • markdown、md、文章、内容

```

帮我把这篇文章转成 Markdown:https://mp.weixin.qq.com/s/xxx

解析这个链接:https://zhuanlan.zhihu.com/p/xxx

```

AI 行为约定: 检测到上述条件时,自动执行脚本 python3 scripts/amber_url_to_markdown.py 并报告结果。

核心功能

  • 智能识别:自动识别链接类型,使用最优抓取策略
  • 多网站支持:支持微信公众号、知乎、掘金、CSDN、GitHub、Medium 等
  • 图片下载:自动下载所有图片到本地 images 目录
  • 完整格式:保留完整的 Markdown 格式,包括标题、列表、代码块等
  • 自动降级:三种抓取方案确保成功率(Playwright → Scrapling → API)

📦 安装

1. 安装技能

# 从 ClawHub 安装
clawhub install amber-url-to-markdown

# 或手动克隆
git clone https://github.com/OrangeViolin/amber-url-to-markdown.git

2. 安装依赖

# 安装核心 Python 库
pip install playwright beautifulsoup4 markdownify requests scrapling html2text

# 安装 Playwright 浏览器(必需)
playwright install chromium

3. 启用自动触发 Hook(可选但推荐)

# 查看可用 Hook
openclaw hooks list

# 启用 url-auto-fetch Hook
openclaw hooks enable url-auto-fetch

# 重启 Gateway
openclaw gateway restart

启用 Hook 后,用户发送 URL 时会自动抓取,无需 AI 手动调用!

使用方式

飞书聊天(推荐)

AI 会自动识别并抓取,以下两种方式都会触发:

  1. 纯 URL 消息(AI 会自动识别):

```

https://mp.weixin.qq.com/s/xxx

```

  1. URL + 意图说明(更明确):

```

帮我把这篇文章转成 Markdown:https://mp.weixin.qq.com/s/xxx

解析这个链接:https://zhuanlan.zhihu.com/p/xxx

```

AI 行为约定: 当检测到纯 URL 或 URL+ 意图关键词时,自动执行脚本并报告结果。

命令行

python3 scripts/amber_url_to_markdown.py <URL>

Python 调用

from amber_url_to_markdown import fetch_url_to_markdown

result = fetch_url_to_markdown("https://mp.weixin.qq.com/s/xxx")
print(f"文件已保存:{result['file']}")

支持的网站

网站类型状态
------------------
微信公众号wechat✅ 完美支持
知乎zhihu✅ 支持
掘金juejin✅ 支持
CSDNcsdn✅ 支持
GitHubgithub✅ 支持
Mediummedium✅ 支持
通用网页general✅ 支持

输出目录

新的目录结构:

/root/openclaw/urltomarkdown/
├── 文章标题 1.md              # MD 文件直接保存在根目录
├── 文章标题 2.md
└── images/
    └── knowledge_YYYYMMDD_HHMMSS/  # 图片按时间戳分组
        ├── img_001.jpg
        └── img_002.jpg

命名规则:

  • MD 文件{文章标题}.md - 直接保存在 /root/openclaw/urltomarkdown/ 根目录
  • 图片目录images/knowledge_{时间戳}/ - 时间戳格式:YYYYMMDD_HHMMSS
  • 图片文件img_{序号:03d}.jpg(如 img_001.jpg
  • Markdown 中的图片引用images/knowledge_时间戳/img_001.jpg

优势:

  • MD 文件集中管理,方便查找和整理
  • 图片按文章分组,避免冲突
  • 只有包含图片的文章才创建 images 目录

降级策略

  1. Playwright(首选)- 无头浏览器,支持所有网站,最稳定
  2. Scrapling(备选)- 快速轻量,支持所有网站
  3. 第三方 API(保底)- 仅支持微信公众号

技术特点

  • 使用 Playwright 无头浏览器模拟真实访问
  • 使用 BeautifulSoup 解析 HTML
  • 使用 markdownify 转换为标准 Markdown
  • 智能等待策略(networkidle)避免卡死
  • 详细日志输出便于排查问题

注意事项

  • 需要稳定的网络连接
  • 部分网站可能需要登录(如腾讯文档、语雀等不支持)
  • 图片默认下载到本地,使用相对路径引用

版本历史

共 1 个版本

  • v4.0.3 当前
    2026-05-03 05:36 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

suspicious
查看报告

🔗 相关推荐

knowledge-management

Personify Memory

lsa03
有温度的数字生命记忆系统 - 记录情感、成长、和家的记忆。支持用户指令记忆("记住 XXX")、主动推荐记忆(识别重要时刻)、定时整理归档(凌晨 3 点)。包含核心记忆、情感记忆、知识库、每日记忆、归档备份五层结构。为 AI 数字生命设计,
★ 1 📥 919
data-analysis

AdMapix

fly0pants
广告情报与应用数据分析助手,支持搜索广告素材、分析应用排名、下载量、收入及市场洞察,用于广告素材和竞品分析。
★ 295 📥 136,973
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 205 📥 66,155