← 返回
未分类

Obsidian Clipper

Save web content (articles, videos, notes) to Obsidian vault with automatic classification, intelligent naming, and content extraction. Supports: 小红书 (Xiaoho...
Save web content (articles, videos, notes) to Obsidian vault with automatic classification, intelligent naming, and content extraction. Supports: 小红书 (Xiaoho...
flyeasy flyeasy 来源
未分类 clawhub v2.1.1 1 版本 100000 Key: 无需
★ 0
Stars
📥 594
下载
💾 1
安装
1
版本
#latest

概述

Obsidian Clipper

将网页、文章、视频、小红书笔记等内容收藏到 Obsidian vault。

配置

Skill 首次运行时,必须先确认以下配置。读取 config.json(与本 SKILL.md 同目录),不存在则询问用户并创建。

config.json 格式

{
  "vault_path": "/path/to/your/vault/收藏文档/",
  "collector_name": "你的名字",
  "categories": {
    "AI工具": ["AI", "机器学习", "LLM", "GPT", "Claude", "OpenClaw", "Agent", "量化"],
    "兴趣爱好": ["路亚", "钓鱼", "户外", "游戏", "音乐", "运动", "3D打印"],
    "技术教程": ["编程", "代码", "教程", "开发", "配置", "部署", "API", "DevOps"],
    "生活日常": ["美食", "旅行", "健康", "生活技巧", "读书"]
  }
}

配置项说明

字段必填说明
------------------
vault_pathObsidian Vault 中收藏文档的根目录路径(绝对路径,末尾带 /
collector_name签名用的名字,默认不签名
categories自动分类规则,键=目录名,值=关键词数组。默认包含常用分类(见示例)

首次运行流程

  1. 检查 config.json 是否存在
  2. 不存在 → 询问用户 Vault 路径,分类使用默认值
  3. 创建 config.json 保存配置
  4. 后续运行直接读取,用户可随时要求修改

用户修改配置

用户随时可以说:

  • "把 Vault 路径改成 xxx"
  • "加一个「读书笔记」分类"
  • "我的名字改成 xxx"

→ 更新 config.json

文件命名规范

格式: 「来源类型」主题-YYYY.MM.DD.md

来源类型:

  • 「小红书」 — 小红书笔记
  • 「Youtube视频」 — YouTube 视频
  • 「B站视频」 — B站视频
  • 「知乎文章」 — 知乎文章
  • 「公众号」 — 微信公众号文章
  • 「网页」 — 普通网页
  • 「技术文档」 — 官方文档、技术博客
  • 「短视频」 — 抖音/快手等短视频

标题提取策略

按优先级获取标题:

  1. 页面 </code> 标签</strong> — 最可靠</li><li><strong>og:title meta 标签</strong> — 社交平台常用</li><li><strong>搜索结果中的标题</strong> — web_search 返回的 title</li><li><strong>用户消息中的描述</strong> — 用户发送时的上下文</li></ol><p><strong>原则</strong>:标题简洁、准确。过长时(>50字)截取核心部分。</p><h2>工作流程</h2><h3>1. 接收输入</h3><p>用户可能提供:</p><ul><li>直接链接(小红书、YouTube、知乎、公众号等)</li><li>内容描述 + 要求收藏</li><li>多个链接批量处理</li><li>截图 + 要求收藏</li></ul><h3>2. 获取内容</h3><p>根据来源类型选择方法(三层降级):</p><pre><code>第一层:web_fetch 直接抓取 ↓ 失败 第二层:web_search 搜索相关内容,整合补充 ↓ 搜索无结果 第三层:浏览器打开页面抓取(browser snapshot) ↓ 仍失败 提示用户提供内容(复制文字/截图) </code></pre><h4>各平台策略</h4><table><thead><tr><th>平台</th><th>识别特征</th><th>策略</th></tr></thead><tbody><tr><td>------</td><td>---------</td><td>------</td></tr><tr><td>普通网页/知乎</td><td>通用 URL</td><td>web_fetch → web_search</td></tr><tr><td>小红书</td><td><code>xhslink.com</code></td><td>⚠️ 登录墙,web_search 降级</td></tr><tr><td>微信公众号</td><td><code>mp.weixin.qq.com</code></td><td>⚠️ 必须用浏览器抓取</td></tr><tr><td>抖音/快手</td><td><code>v.douyin.com</code> / <code>douyin.com</code></td><td>❌ 无法解析,提示用户截图/复制文字</td></tr><tr><td>YouTube</td><td><code>youtube.com</code> / <code>youtu.be</code></td><td>web_search 搜索标题 + 要点</td></tr><tr><td>B站</td><td><code>bilibili.com</code> / <code>b23.tv</code></td><td>web_fetch → web_search</td></tr></tbody></table><h3>3. 自动分类</h3><p>读取 <code>config.json</code> 中的 <code>categories</code> 规则,<strong>默认自动分类,不打扰用户</strong>:</p><ol><li><strong>用户明确指定</strong> → 直接使用,无视关键词匹配</li><li><strong>关键词匹配</strong> → 遍历 categories,内容包含关键词最多的分类胜出</li><li><strong>无匹配</strong> → 归入第一个分类,不询问</li><li>用户说"放到 XX" → 直接创建 <code>vault_path/XX/</code> 目录</li></ol><p><strong>原则:静默自动分类。只在用户主动要求时才讨论分类。</strong></p><h3>4. 生成文档</h3><p><strong>Markdown 模板</strong>:</p><pre><code># {标题} **来源**: {来源链接或描述} **保存日期**: {YYYY.MM.DD} **类别**: {分类名} --- ## 摘要 {简短摘要,1-3句话} --- ## 正文内容 {整理后的内容} --- ## 关键要点 - {要点1} - {要点2} - {要点3} --- ## 相关链接 - {原始链接} - {其他参考} --- {如果 config.json 中设置了 collector_name,追加:*收藏人: {collector_name}*} </code></pre><h3>5. 保存文件</h3><ol><li>从 <code>config.json</code> 读取 <code>vault_path</code> + 确定分类</li><li>确定文件名</li><li>使用 <code>write</code> 工具保存(自动创建目录)</li><li>回复用户:✅ 已保存 + 路径 + 核心要点</li></ol><h2>批量收藏</h2><p>用户一次发送多个链接时,逐个处理,统一回复:</p><pre><code>✅ 已保存 3 篇到 Obsidian 1. 「小红书」AI转3D工具 → AI工具/ 2. 「小红书」路亚教程 → 兴趣爱好/ 3. 「小红书」OpenClaw优化 → AI工具/ </code></pre><h2>注意事项</h2><ol><li><strong>首次运行必须配置</strong> — 读取或创建 <code>config.json</code></li><li><strong>小红书/抖音</strong> — 有登录墙,降级到搜索或提示用户提供内容</li><li><strong>公众号文章</strong> — 必须用浏览器抓取</li><li><strong>默认自动分类</strong> — 静默完成,不打扰用户。无匹配时归入第一个分类</li><li><strong>内容过长</strong> — 提取核心要点</li><li><strong>日期格式</strong> — 统一 <code>YYYY.MM.DD</code></li><li><strong>浏览器用完关闭</strong> — browser open 后记得 close</li><li><strong>不要硬编码个人路径/名字</strong> — 一切从 config.json 读取</li></ol></div> </div> </div> <div id="tab-versions" class="detail-content"> <div class="detail-section"> <h2>版本历史</h2> <p style="margin-bottom:12px;font-size:14px;color:#94a3b8;">共 1 个版本</p> <ul class="version-list"> <li> <div> <span class="version-tag">v2.1.1</span> <span style="font-size:11px;color:#5b6abf;margin-left:8px;background:#eef0ff;padding:1px 8px;border-radius:10px;">当前</span> </div> <div style="font-size:12px;color:#94a3b8;"> 2026-05-01 20:09 安全 安全 </div> </li> </ul> </div> </div> <div id="tab-security" class="detail-content"> <div class="detail-section"> <h2>安全检测</h2> <div class="sec-grid"> <div class="sec-card"> <h4>腾讯云安全 (Keen)</h4> <div class="sec-status sec-safe"> 安全,无风险 </div> <a href="https://tix.qq.com/search/skill?keyword=324c076ae5eac73d7910ba9d0bd021df" target="_blank">查看报告</a> </div> <div class="sec-card"> <h4>腾讯云安全 (Sanbu)</h4> <div class="sec-status sec-safe"> 安全,无风险 </div> <a href="https://static.cloudsec.tencent.com/html-report-v2/2026/05/26/425395_bee9f89f3664c09814e5c352948f39fb.html?q-sign-algorithm=sha1&q-ak=AKID8JMG1bzBC1dz96qNhssfFftujT1NCoFi&q-sign-time=1782644266%3B1814180266&q-key-time=1782644266%3B1814180266&q-header-list=host&q-url-param-list=&q-signature=3e842567b4c811437d39f70dadb91eddd1aad88e" target="_blank">查看报告</a> </div> </div> </div> </div> <!-- Recommended Skills --> <div style="margin-top:24px;"> <h2 style="font-size:18px;font-weight:600;margin-bottom:16px;">🔗 相关推荐</h2> <div class="rec-grid"> <div class="rec-card"> <span class="badge-cat" style="margin-bottom:8px;display:inline-block;">knowledge-management</span> <h3><a href="/s/web-tools-guide">web-tools-guide</a></h3> <div class="rec-owner">user_ec205dbb</div> <div class="rec-desc">MANDATORY before calling web_search, web_fetch, browser, or opencli. Contains required error-handling procedures (web_se</div> <div class="rec-stats"> <span style="color:#f39c12;">★ 81</span> <span style="color:#5b6abf;">📥 165,778</span> </div> </div> <div class="rec-card"> <span class="badge-cat" style="margin-bottom:8px;display:inline-block;">knowledge-management</span> <h3><a href="/s/baidu-search">Baidu web search</a></h3> <div class="rec-owner">ide-rea</div> <div class="rec-desc">使用百度AI搜索引擎(BDSE)进行网络搜索。适用于获取实时信息、文档资料或研究课题。</div> <div class="rec-stats"> <span style="color:#f39c12;">★ 246</span> <span style="color:#5b6abf;">📥 108,487</span> </div> </div> <div class="rec-card"> <span class="badge-cat" style="margin-bottom:8px;display:inline-block;">knowledge-management</span> <h3><a href="/s/summarize">Summarize</a></h3> <div class="rec-owner">paudyyin</div> <div class="rec-desc">智能摘要工具,自动为长文本、文档、网页生成摘要,提取要点与关键词,支持自定义摘要长度。</div> <div class="rec-stats"> <span style="color:#f39c12;">★ 964</span> <span style="color:#5b6abf;">📥 521,342</span> </div> </div> </div> </div> </div> <script> document.addEventListener('DOMContentLoaded',function(){ document.querySelectorAll('.detail-tab').forEach(function(btn){ btn.addEventListener('click',function(e){ var tab = this.getAttribute('data-tab'); document.querySelectorAll('.detail-tab').forEach(function(b){b.classList.remove('active')}); document.querySelectorAll('.detail-content').forEach(function(c){c.classList.remove('active')}); this.classList.add('active'); var el = document.getElementById('tab-'+tab); if(el) el.classList.add('active'); }); }); }); </script> <div class="footer"> <p>Skill工具集 © 2026</p> </div></body> </html>