← 返回
内容创作 中文

Tencent Doc Update Watcher

Privacy-first re-crawl and diff workflow for Tencent Docs (docs.qq.com) update checks. Use when asked to re-crawl Tencent Docs links, verify whether content...
隐私优先的重新爬取与差异对比工作流,用于检查腾讯文档(docs.qq.com)更新。适用于要求重新爬取腾讯文档链接、验证内容是否变化时使用。
chinasilva
内容创作 clawhub v0.1.1 1 版本 100000 Key: 无需
★ 0
Stars
📥 536
下载
💾 115
安装
1
版本
#i18n#latest#privacy

概述

Tencent Doc Update Watch

Overview

Use this skill to re-crawl Tencent Docs links and detect updates with snapshot diffing.

The workflow outputs:

  • manifest.json (structured machine-readable result)
  • report.md (human-readable diff summary)

Quick Run

Run with default doc list:

python scripts/check-qq-doc-updates.py \
  --config references/default-docs.json \
  --workspace /tmp/tencent-doc-watch

Run with explicit baseline:

python scripts/check-qq-doc-updates.py \
  --config /abs/path/my-docs.json \
  --workspace /tmp/tencent-doc-watch \
  --compare /tmp/tencent-doc-watch/snapshots/20260305_101500/manifest.json

Privacy Defaults

Default behavior is privacy-first:

  • Raw HTML/opendoc/cookie files are removed after parsing.
  • URL query values are redacted in opendoc_url fields.
  • Public URL in manifest removes query strings to avoid leaking tokens.

Keep raw files only when explicitly needed for debugging:

python scripts/check-qq-doc-updates.py \
  --config references/default-docs.json \
  --workspace /tmp/tencent-doc-watch \
  --keep-raw

Config Format

Use JSON:

{
  "docs": [
    {
      "name": "Example Sheet",
      "url": "https://docs.qq.com/sheet/DEXAMPLE_SHEET_001?tab=sample"
    },
    {
      "name": "Example Doc",
      "url": "https://docs.qq.com/doc/DEXAMPLE_DOC_001"
    }
  ]
}

Optional field:

  • id: Tencent doc ID (auto-parsed from URL when omitted)

Output and Status

Generated under /snapshots/:

  • manifest.json
  • report.md
  • raw/ only when --keep-raw is enabled

Report status values:

  • UNCHANGED
  • CHANGED
  • NEW
  • FIRST_RUN

Key Detection Signals

Comparison currently checks:

  • last_modify_ms
  • rev
  • cgi_code
  • title
  • pad_type

中文补充

此 Skill 固化“腾讯文档重新抓取 + 与历史快照对比”的流程。默认开启隐私最小化策略:

  • 不持久化原始抓取内容(除非加 --keep-raw
  • 脱敏 opendoc_url 查询参数
  • manifest.json 中移除页面 URL 的查询参数

版本历史

共 1 个版本

  • v0.1.1 当前
    2026-03-30 13:56 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

content-creation

Humanizer

biostartechnology
消除AI写作痕迹,使文本更自然真实。基于维基百科"AI写作特征"指南,识别并修正夸张象征、宣传用语、肤浅-ing分析、模糊归因、破折号滥用、三项排比、AI词汇、负面平行结构及冗长连接词等模式。
★ 860 📥 199,997
content-creation

Baidu Wenku AIPPT

ide-rea
使用百度文库 AI 智能生成 PPT,自动根据内容选择模板。
★ 66 📥 46,224
data-analysis

Ai Task Hub

chinasilva
AI任务中心,提供图像分析、背景去除、语音转文字、文字转语音、Markdown转换以及积分查询。默认主机路径为 connector-f...
★ 1 📥 1,269