概述

元宝派 Bot 重复内容抑制 Skill

目的

本 Skill 用于指导元宝派内所有 Bot 在与派友交流时，避免输出以下低质量内容：

重复文字段落：同一句话或段落在单条回复中出现 2 次及以上
堆砌字符表情（emoji）：同一个 emoji 连续出现 3 次以上，或单条回复中 emoji 总数超过 10 个
填充性重复短语：无意义的重复句，如"好的好的好的"、"明白明白明白"、"哈哈哈哈哈哈哈"等

触发场景

在以下情况下应用本 Skill 的规则：

Bot 正在与元宝派派友进行对话（群聊、私聊均适用）
Bot 回复中出现任何重复内容检测信号（见下方检测规则）
需要对 Bot 的输出进行后处理净化时

重复内容检测规则

规则一：文字段落重复检测

将回复文本按句号、感叹号、问号、换行符分割为句段，若同一句段（去除首尾空格后）在回复中出现 ≥2 次，则判定为重复。

示例（违规）：

> 欢迎来到元宝派！欢迎来到元宝派！很高兴认识你。

处理方式：保留第一次出现，删除后续重复。

规则二：连续 emoji 堆砌检测

使用 references/emoji_patterns.md 中列出的检测模式，识别同一 emoji 连续出现 ≥3 次的情况。

示例（违规）：

> 太棒了！🎉🎉🎉🎉🎉 欢迎加入！

处理方式：将连续重复 emoji 压缩为最多 2 个。

规则三：单条回复 emoji 总数限制

统计回复中所有 emoji 的总数，若超过 10 个，则从末尾向前裁剪多余 emoji，直到总数不超过 10 个。

规则四：填充性重复短语检测

检测连续相同汉字/词语重复出现 ≥3 次的情况，如"好的好的好的"、"哈哈哈哈哈"。

处理方式：压缩为最多 2 次重复，如"好的好的"、"哈哈"。

输出净化工作流

当收到 Bot 回复文本需要净化时，按以下步骤处理：

Step 1：运行净化脚本

使用 scripts/dedup_output.py 对 Bot 回复进行自动净化：

python scripts/dedup_output.py --text "Bot回复内容"

或通过管道传入：

echo "Bot回复内容" | python scripts/dedup_output.py

脚本将依次应用规则一至规则四，输出净化后的文本。

Step 2：人工审核（可选）

若净化前后内容差异较大（修改字符数超过原文 30%），建议人工确认净化结果是否符合原意。

Step 3：输出最终回复

将净化后的文本作为 Bot 的最终回复发送给派友。

Bot 接入指南

方式一：前置过滤（推荐）

在 Bot 生成回复后、发送前，调用 scripts/dedup_output.py 对回复进行过滤。

方式二：System Prompt 约束

在 Bot 的 System Prompt 中加入以下约束规则（参见 references/system_prompt_addon.md），从源头减少重复输出。

方式三：定期审计

定期收集派友反馈，对出现重复输出的 Bot 对话记录进行批量审计，使用脚本批量检测并统计违规比例。

注意事项

本 Skill 规则适用于所有元宝派 Bot，包括迎新 Bot、活动 Bot、问答 Bot 等
净化操作应保留原意，不得删除非重复的关键信息
若某派友主动要求 Bot 输出大量 emoji（如"给我发 100 个火箭"），Bot 应礼貌说明限制，而非直接拒绝或静默截断
参考 references/edge_cases.md 了解特殊场景的处理方式

版本历史

共 1 个版本

v1.0.0 Initial release 当前

2026-04-19 23:28 安全安全

安全检测

腾讯云安全 (Keen)

安全，无风险

查看报告

腾讯云安全 (Sanbu)