本 Skill 用于指导元宝派内所有 Bot 在与派友交流时,避免输出以下低质量内容:
在以下情况下应用本 Skill 的规则:
将回复文本按句号、感叹号、问号、换行符分割为句段,若同一句段(去除首尾空格后)在回复中出现 ≥2 次,则判定为重复。
示例(违规):
> 欢迎来到元宝派!欢迎来到元宝派!很高兴认识你。
处理方式:保留第一次出现,删除后续重复。
使用 references/emoji_patterns.md 中列出的检测模式,识别同一 emoji 连续出现 ≥3 次的情况。
示例(违规):
> 太棒了!🎉🎉🎉🎉🎉 欢迎加入!
处理方式:将连续重复 emoji 压缩为最多 2 个。
统计回复中所有 emoji 的总数,若超过 10 个,则从末尾向前裁剪多余 emoji,直到总数不超过 10 个。
检测连续相同汉字/词语重复出现 ≥3 次的情况,如"好的好的好的"、"哈哈哈哈哈"。
处理方式:压缩为最多 2 次重复,如"好的好的"、"哈哈"。
当收到 Bot 回复文本需要净化时,按以下步骤处理:
使用 scripts/dedup_output.py 对 Bot 回复进行自动净化:
python scripts/dedup_output.py --text "Bot回复内容"
或通过管道传入:
echo "Bot回复内容" | python scripts/dedup_output.py
脚本将依次应用规则一至规则四,输出净化后的文本。
若净化前后内容差异较大(修改字符数超过原文 30%),建议人工确认净化结果是否符合原意。
将净化后的文本作为 Bot 的最终回复发送给派友。
在 Bot 生成回复后、发送前,调用 scripts/dedup_output.py 对回复进行过滤。
在 Bot 的 System Prompt 中加入以下约束规则(参见 references/system_prompt_addon.md),从源头减少重复输出。
定期收集派友反馈,对出现重复输出的 Bot 对话记录进行批量审计,使用脚本批量检测并统计违规比例。
references/edge_cases.md 了解特殊场景的处理方式
共 1 个版本