← 返回
未分类 Key

Discord 消息拉取

从指定 Discord 频道批量拉取/导出聊天消息(自动翻页、突破单次 100 条上限),输出为结构化数据(发言人、时间、正文、附件等),可选地写入飞书多维表格(Bitable)。只要用户想获取、导出或同步某个 Discord 频道的消息记录,就使用本技能——无论是否提到飞书;典型信号包括提供了 Discord bot token + channel id、说「拉取/获取/导出 Discord 消息」「同步 Discord 频道聊天」「Discord channel messages to 飞书/Bitable」「自动翻页抓频道历史」。支持全量拉取与基于消息 ID 的增量同步。仅适用于 Discord,且为只读拉取:不处理发送消息、构建 bot、Slack/Telegram 等其他平台、或分析已导出的数据。
从指定 Discord 频道批量拉取/导出聊天消息(自动翻页、突破单次 100 条上限),输出为结构化数据(发言人、时间、正文、附件、embed 等),可选地写入飞书多维表格(Bitable)。只要用户想获取、导出或同步某个 Discord 频道的消息记录,就使用本技能——无论是否提到飞书;典型信号包括提供了 Discord bot token + channel id、说「拉取/获取/导出 Discord 消息」「同步 Discord 频道聊天」「Discord channel messages to 飞书/Bitable」「自动翻页抓频道历史」。支持全量拉取、日期范围过滤与基于消息 ID 的增量同步,可一键输出 JSON/CSV/Markdown。仅适用于 Discord,且为只读拉取:不处理发送消息、构建 bot、Slack/Telegram 等其他平台、或分析已导出的数据。
joy
未分类 community v1.0.1 2 版本 96969.7 Key: 需要
★ 1
Stars
📥 12
下载
💾 0
安装
2
版本
#latest

概述

---

name: discord-fetch

description: 从指定 Discord 频道批量拉取/导出聊天消息(自动翻页、突破单次 100 条上限),输出为结构化数据(发言人、时间、正文、附件、embed 等),可选地写入飞书多维表格(Bitable)。只要用户想获取、导出或同步某个 Discord 频道的消息记录,就使用本技能——无论是否提到飞书;典型信号包括提供了 Discord bot token + channel id、说「拉取/获取/导出 Discord 消息」「同步 Discord 频道聊天」「Discord channel messages to 飞书/Bitable」「自动翻页抓频道历史」。支持全量拉取、日期范围过滤与基于消息 ID 的增量同步,可一键输出 JSON/CSV/Markdown。仅适用于 Discord,且为只读拉取:不处理发送消息、构建 bot、Slack/Telegram 等其他平台、或分析已导出的数据。

metadata:

version: "1.1.0"

author: joy20260328@gmail.com

tags: [discord, feishu, bitable, data-sync]

requirements:

python: ">=3.9"


Discord 频道消息拉取

把指定 Discord 频道的聊天记录拉成干净的结构化 JSON/CSV,每条消息是一行扁平记录,可直接写入飞书多维表格。拉取逻辑(翻页、限流退避、去重)封装在 scripts/discord_fetch.py 里,写入逻辑封装在 scripts/feishu_write.py 里,执行脚本即可,不要自己重写 HTTP 调用

前置条件(首次使用必读)

用户需要在 Discord 端准备好(详见 references/setup.md):

  1. 一个 Bot Token(开发者后台 → 应用 → Bot → Reset Token)。
  2. 已把 bot 邀请进目标服务器
  3. 开启 Message Content Intent,否则拉到的消息正文 content 会是空的——这是最常见的坑。
  4. bot 在目标频道有 "View Channel" + "Read Message History" 权限。
  5. 一个 Channel ID(Discord 开启开发者模式 → 右键频道 → 复制频道 ID)。

如需写入飞书,还需要:飞书应用的 FEISHU_APP_IDFEISHU_APP_SECRET,以及目标多维表格的 app_tokentable_id

Token 的提供方式(按安全优先级)

  1. 环境变量 DISCORD_BOT_TOKEN(推荐):不进对话上下文、不入日志,最安全。
  2. --token 参数:仅在多 token 临时切换时使用。

绝不要把完整 token 写进回复正文或反复回显。脚本内部只会显示首尾各 4 位的指纹。

操作步骤

第零步:环境自检(推荐首次运行)

python scripts/discord_fetch.py --channel <CHANNEL_ID> --check

一次性验证:token 有效 + bot 能访问频道 + Message Content Intent 已开启。出错时有明确提示。

第一步(可选):确认能看到频道

python scripts/discord_fetch.py --channel <CHANNEL_ID> --info

第二步:拉取消息

全量(最新 N 条,自动翻页):

python scripts/discord_fetch.py --channel <CHANNEL_ID> --max 200 --format json

按日期范围过滤:

python scripts/discord_fetch.py --channel <CHANNEL_ID> \
  --after-date 2026-01-01 --before-date 2026-02-01

增量同步(只拉比检查点更新的消息):

python scripts/discord_fetch.py --channel <CHANNEL_ID> --after <上次的_newest_message_id>

导出 CSV:

python scripts/discord_fetch.py --channel <CHANNEL_ID> --max 500 --format csv > messages.csv

输出 JSON 结构:

{
  "channel_id": "...",
  "count": 123,
  "newest_message_id": "...",
  "oldest_message_id": "...",
  "reached_end": true,
  "messages": [
    {
      "message_id": "...", "channel_id": "...",
      "author_id": "...", "author_username": "...", "author_global_name": "...",
      "is_bot": false, "content": "消息正文",
      "timestamp": "2026-01-01T00:00:00+00:00", "edited_timestamp": null,
      "reply_to_message_id": null,
      "attachment_count": 0, "attachments": [], "embed_count": 0, "embeds": []
    }
  ]
}

第三步:写入飞书多维表格

# 一条命令完成拉取 + 写入
python scripts/discord_fetch.py --channel <CHANNEL_ID> --max 500 \
  | python scripts/feishu_write.py \
      --app-token <BITABLE_APP_TOKEN> \
      --table-id <TABLE_ID>

先 dry-run 预览不写入:

python scripts/discord_fetch.py --channel <CHANNEL_ID> --max 10 \
  | python scripts/feishu_write.py \
      --app-token <BITABLE_APP_TOKEN> --table-id <TABLE_ID> --dry-run

关键约定:多维表格里的 message_id 列设为唯一标识去重;每次拉取后存下 newest_message_id,下次作为 --after 传入做增量同步。

详细字段映射与增量同步编排见 references/feishu-bitable.md,更多用法示例见 examples/

注意事项

  • 消息正文为空,几乎都是没开 Message Content Intent,先去后台开启(或运行 --check)。
  • --max 上限 5000,频道很大时建议分批 + 增量同步。
  • 触发 429(限流)脚本会自动退避重试,一般无需干预。
  • 脚本进度和日志输出到 stderr,stdout 只有干净的 JSON/CSV,可以直接管道到下游。

版本历史

共 2 个版本

  • v1.0.1 一、新增功能 1. 新增环境自检命令:支持 --check 一键校验 Token 有效性、频道访问权限、Message Content Intent 开启状态,解决首次配置调试难题,无需盲目排查问题。 2. 新增日期范围过滤能力:上线--after-date / --before-date 参数,直接传入 YYYY-MM-DD 日期格式即可过滤消息,无需手动换算 Discord 消息 ID,操作更便捷。 3. 拓展输出格式:在原有 JSON、Markdown 格式基础上,新增 --format csv 输出模式,文件可直接用 Excel 打开,也支持导入各类第三方系统。 4. 新增飞书批量写入脚本:新增 scripts/feishu_write.py 配套脚本,支持管道直连、500条批量写入、--dry-run 预览功能,一条命令即可完成全流程操作。 5. 完善消息内容解析:优化 Embed 内容展示,从仅统计数量升级为完整输出 title、description、url、type 全量信息;同时为附件字段 attachments 新增 content_type(如 image/png)类型标注,数据维度更完整。 6. 新增拉取进度反馈:批量拉取消息时,每页自动在 stderr 输出已拉取数量,解决大量数据拉取时无响应、黑屏等待的问题,交互更友好。 7. 补充场景化示例文档:在 examples 目录下新增基础拉取、日期过滤、增量同步、全流程管道等典型使用场景示例,降低用户上手门槛。 二、其他优化与调整 1. 明确环境要求:更新 SKILL.md,声明项目 Python 版本需 ≥ 3.9; 2. 版本迭代:项目版本号升级至 1.1.0。 当前
    2026-06-09 11:31 安全 安全
  • v1.0.0 Initial release
    2026-06-09 10:59 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

ai-intelligence

self-improving agent

pskoett
捕获经验教训、错误和纠正,以实现持续改进。使用时机:(1)命令或操作意外失败;(2)用户纠正……
★ 4,057 📥 796,719
developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 668 📥 323,869
security-compliance

Skill Vetter

spclaudehome
AI智能体技能安全预审工具。安装ClawdHub、GitHub等来源技能前,检查风险信号、权限范围及可疑模式。
★ 1,211 📥 266,245