公众号违禁词查询是一款专为公众号内容创作者和运营人员设计的合规检测工具,基于官方违禁词库实时同步,覆盖广告法、医疗美容、金融风险等 10+ 类目。
通过简单的文案输入,你可以:
适用于公众号运营、新媒体编辑、品牌市场团队、设计师等需要确保文案合规发布的场景。
本 Skill 基于 Python 脚本,通过 API 调用远端违禁词检测服务,支持文本、文件、网页、图片四种输入方式。
| 功能 | 说明 |
|------|------|
| 违禁词扫描 | 基于官方违禁词库,覆盖广告法极限词、医疗美容、金融风险、教育培训等 10+ 类目 |
| 风险标注 | 命中违禁词在原文中加粗显示,同时汇总违禁词类型与数量 |
| 智能替换 | 每个违禁词提供结合上下文的替换表达,附更换理由,不是机械同义词替换 |
| 优化文案生成 | 直接输出替换后的完整合规版本,替换处加粗标记,保持原文语气和风格 |
pip install requests python-docx beautifulsoup4 playwright
playwright install chromium
| 配置方式 | 操作 | 说明 |
|----------|------|------|
| 环境变量(推荐) | export REDFOX_API_KEY=ak_xxxxxxxx | 在当前终端会话生效 |
| Shell 配置文件 | 将上述 export 语句写入 ~/.bashrc 或 ~/.zshrc,执行 source ~/.bashrc | 永久生效,脚本自动读取 |
> 脚本获取 Key 的优先级:环境变量 REDFOX_API_KEY → Shell 配置文件自动扫描 → 提示用户配置
最常用的方式,适合快速检测草稿:
> 用户:帮我看下这篇公众号草稿有没有违禁词:这款美白神器真的太有效了,用了三天就白了一个度
>
> 助手:自动检测并输出违禁词标注、替换建议表和优化后文案
支持 TXT、DOC、DOCX 格式,直接上传即可自动读取检测。
上传海报截图或推文截图,系统自动提取图中文字进行检测(仅提取文字内容,不分析图片视觉风格)。
提供文章 URL,系统自动抓取页面正文内容进行检测。
注意事项:
| 命令 | 用途 |
|------|------|
| python scripts/check_sensitive_words.py --content="文案" | 检测文本内容 |
| python scripts/check_sensitive_words.py --file=/path/file.txt | 检测文件内容 |
| python scripts/check_sensitive_words.py --url=https://... | 检测网页内容 |
| python scripts/check_sensitive_words.py --file=/path/file.txt --extract-only | 仅提取文本,不检测 |
角色:公众号运营
需求:推文发出前确认没有极限词、禁用宣传用语,避免被平台删改或封号
使用方式:
预期效果:提前排除合规风险,降低删文概率
角色:新媒体编辑
需求:日常产出多篇短文,需要在发布前统一过一遍合规检查
使用方式:
预期效果:一次完成多篇检测,提升审稿效率
角色:品牌/市场团队
需求:H5 页面、活动落地页上线前确认文案无违规风险
使用方式:
预期效果:避免活动页面因违规词被举报或下架
角色:设计师
需求:海报中的营销文案需要确保不触犯广告法
使用方式:
预期效果:在设计阶段即排除文字风险,减少返工
wechat-prohibited-word/
├── SKILL.md # Skill 说明文档(本文件)
├── scripts/
│ └── check_sensitive_words.py # 核心检测脚本
└── references/
└── core_workflow.md # Agent 执行规程(输出模板、格式铁律等)
| 组件 | 技术 | 说明 |
|------|------|------|
| 运行环境 | Python 3.7+ | 脚本执行环境 |
| HTTP 请求 | requests | 标准 HTTP 库,调用检测 API |
| 文档解析 | python-docx | Word 文档 (.doc/.docx) 文本提取 |
| 网页解析 | beautifulsoup4 + playwright | 静态 HTML 解析 + JS 动态页面渲染 |
| API 服务 | 红狐Hub | 官方违禁词库,POST+JSON 方式调用 |
用户输入(文本/文件/网页/图片)
→ 脚本提取文本内容
→ HTTPS POST 发送至红狐Hub API
→ API 匹配违禁词库,返回标注结果
→ 脚本过滤英文误匹配,格式化输出 JSON
→ Agent 按模板呈现三板块结果 + 写入优化文案文件
Q: 安装依赖时报错怎么办?
A: 请确认 Python 版本≥3.7,并依次执行:
pip install --upgrade pip
pip install requests python-docx beautifulsoup4 playwright
playwright install chromium
Q: 提示 "未配置 REDFOX_API_KEY" 怎么办?
A: 请按以下步骤处理:
ak_xxxxxxxx)
export REDFOX_API_KEY=ak_xxxxxxxx 或写入 ~/.bashrc
Q: 支持检测哪些类型的违禁词?
A: 覆盖广告法极限词("最好""第一"等)、医疗美容禁宣用语、金融收益承诺、教育培训夸大宣传、虚假广告用语、诱导分享话术等 10+ 类目。
Q: 长文案怎么处理?
A: 3000 字以内直接检测;超过 3000 字会自动询问是否分批检测,在自然断句处切割保证语义完整;超过 10000 字建议手动分批。
Q: 英文内容会被误判吗?
A: 不会。脚本内置英文误匹配过滤,正常英文单词中的子串不会被标记为违禁词。
Q: 检测接口超时或报错?
A: 脚本内置自动重试机制(最多 2 次),若仍然失败请稍后重试。持续异常请联系服务提供商。
Q: 网页内容提取失败?
A: 部分需要登录或有反爬机制的页面无法提取。建议直接复制页面文字后粘贴检测。
Q: 上传的文件无法识别?
A: 支持的文本文件格式:TXT、DOC、DOCX、CSV、MD、LOG、JSON、XML、HTML。PDF 不支持,请转为图片或文本文件。
如有其他问题,可通过以下方式获取支持:
> Agent 执行规程:进行检测、格式化输出前,必须先读取并严格遵循 references/core_workflow.md 全文。该文档包含输出模板、格式铁律、分批询问话术、异常处理表等完整执行细节。
共 3 个版本