抖音违禁词检测是一款专为抖音内容创作者和运营人员设计的智能合规检测工具,帮你快速排查文案中的违禁词并给出安全替换方案。
> 视频被限流、文案被下架?可能就是一两个词惹的祸。把文案扔进来,快速告诉你哪里踩雷、怎么改才安全。
通过简单的输入操作,你可以:
适用于短视频编导、电商运营、直播策划、品牌市场等需要确保抖音文案合规发布的场景。
ak_xxxxxxxx)
# 1. 安装 Python 依赖
pip install python-docx==1.1.0 beautifulsoup4==4.12.3 playwright==1.58.0
# 2. 安装 Playwright 浏览器(网页检测需要)
playwright install chromium
将 API Key 配置为环境变量 REDFOX_API_KEY:
方式一:临时设置(当前终端会话有效)
export REDFOX_API_KEY=ak_xxxxxxxx
方式二:永久设置(推荐)
# Bash 用户
echo 'export REDFOX_API_KEY=ak_xxxxxxxx' >> ~/.bashrc
source ~/.bashrc
# Zsh 用户
echo 'export REDFOX_API_KEY=ak_xxxxxxxx' >> ~/.zshrc
source ~/.zshrc
| 变量名 | 必填 | 说明 |
|--------|------|------|
| REDFOX_API_KEY | 是 | RedFox API 访问密钥,格式 ak_xxxxxxxx,脚本自动通过 X-API-KEY 请求头附加 |
最简单的用法,直接把抖音文案粘贴进来:
> 用户:帮我看下这段抖音脚本有没有违禁词:这款美白神器真的太有效了,用了三天就白了一个度
检测完成后自动输出三个板块:检测结果 → 修改建议 → 优化文案,并自动生成可下载的纯文本文件。
支持 TXT、DOC、DOCX 文件,直接上传即可自动提取文字并检测:
> 用户:[上传 script.docx] 帮我检查这个文档
脚本自动提取文件内容 → 字数判断 → 调用检测 API → 输出结果。
上传视频截图或字幕截图,自动提取图中文字进行检测(仅提取文字,不分析图片内容):
> 用户:[上传字幕截图.png] 检测图片里的文字有没有违禁词
直接粘贴网页地址,自动抓取页面文字内容进行检测:
> 用户:帮我检测这个网页 https://example.com/article
当文案超过 3000 字时,系统会自动暂停并询问:
当文案超过 10000 字时,系统会提示建议手动分批,不执行检测。
| 输入形态 | 助手动作 |
|----------|----------|
| 纯文本 | 计算字数 → 字数闸门 → --content="..." → 三板块输出 → 写文件 |
| 上传 TXT/DOC/DOCX | --file=path --extract-only 查字数 → 按规则检测 → 三板块输出 → 写文件 |
| 上传图片 | 仅提取图中文字 → 计算字数 → --content="提取文字" → 三板块输出 → 写文件 |
| 粘贴 https://... | --url=... --extract-only 查字数 → 按规则检测 → 三板块输出 → 写文件 |
| 超长文案(3000~10000) | 发出询问语,收到 1/2/3 后再继续 |
| 超长文案(>10000) | 直接提示建议手动分批,不执行检测 |
--content、--file、--url 三者互斥,每次调用仅传一个。平台已固定为抖音,无需指定。
检测成功时,输出固定包含三个板块(顺序固定,禁止增减):
| 板块 | 内容 |
|------|------|
| 🔍 违禁词检测结果 | 检测平台、违禁词数量、违禁词类型 |
| 💡 修改建议 | 违禁词 → 替换词 → 更换理由 表格 |
| ✏️ 建议优化文案 | 替换后的完整文案,替换处加粗显示 |
未检测到违禁词时,仅输出「未检测到违禁词,文案内容合规✅」,不输出后两个板块。
重要:三板块输出完成后,会自动将纯文本优化文案写入 ./抖音_优化文案_{随机6位数字}.txt 并以文件卡片形式发送给用户,可直接点击下载。
角色:短视频编导/创作者
需求:口播脚本、字幕文案发布前排查极限词、禁宣用语
使用方式:
预期收益:避免因违禁词导致视频限流或下架,安心发布
角色:电商运营
需求:商品详情页、活动页文案上架前批量合规检测
使用方式:
预期收益:批量排查,避免商品因文案违规被下架处罚
角色:直播话术策划
需求:直播间台词、促销话术上线前快速过筛
使用方式:
预期收益:保障直播话术合规,降低直播风险
角色:品牌/市场团队
需求:落地页、H5 活动页发布前文案合规抽查
使用方式:
预期收益:快速完成页面文案审核,避免对外发布后出现问题
douyin-prohibited-word/
├── SKILL.md # Skill 说明文档(本文件)
├── references/
│ └── core_workflow.md # 完整执行规程(输出模板、铁律、详细步骤)
├── scripts/
│ └── check_sensitive_words.py # 核心检测脚本
└── _meta.json # 元数据配置
| 组件 | 技术 |
|------|------|
| 运行环境 | Python 3.8+ |
| HTTP 请求 | requests(Python 原生 HTTP 库,自动重试) |
| 文档解析 | python-docx(DOC/DOCX) |
| 网页提取 | Playwright(JS 动态页面)+ BeautifulSoup4(静态页面回退) |
| 检测平台 | 抖音(硬编码) |
| 模块 | 文件 | 职责 |
|------|------|------|
| 文本提取 | check_sensitive_words.py — extract_from_file() / extract_from_web() | 从文件、网页中提取文本内容 |
| 违禁词检测 | check_sensitive_words.py — check_sensitive_words() | 调用违禁词检测 API,返回标记后的 HTML + 违禁词列表 |
| 英文误匹配过滤 | check_sensitive_words.py | 自动过滤英文单词内部子串误标(如 "Glasswing" 中的 "ass") |
| 执行规程 | references/core_workflow.md | 完整的输出模板、执行铁律、超长内容处理规则、异常处理话术 |
Q1: 安装时提示缺少依赖库怎么办?
A: 按以下命令安装缺失的依赖:
pip install python-docx==1.1.0 beautifulsoup4==4.12.3 playwright==1.58.0
playwright install chromium
Q2: Playwright 安装失败怎么办?
A: 网页检测需要 Playwright 渲染 JS 页面。如果 Playwright 不可用,脚本会自动回退到静态页面提取方式,不影响其他功能使用。
Q3: 一次最多能检测多少内容?
A: 单次检测上限 3000 字符。3000~10000 字符支持分批检测后自动合并,超过 10000 字符建议手动分批。
Q4: 支持哪些文件格式?
A: 支持 TXT、DOC、DOCX、CSV、MD 等文本类型文件,以及常见图片格式(提取图中文字)。暂不支持 PDF,请转为图片或文本文件后上传。
Q5: 数据会外传吗?如何保障隐私?
A: 文案将通过加密 HTTPS 连接发送至检测服务进行匹配,不在本地存储。
Q6: 检测服务返回异常怎么办?
A: 脚本内置自动重试机制(最多 3 次),偶尔网络波动会自动重试。如果多次重试仍失败,请稍后重试或联系技术支持。
Q7: 英文单词被误判为违禁词?
A: 已内置英文误匹配过滤。脚本会自动识别并过滤英文单词内部子串误标(如 "Glasswing" 中的 "ass"),无需额外处理。
Q8: 文件或网页提取失败?
A: 请检查文件格式是否正确、网址是否可正常访问。PDF 文件不支持,请先转换为图片或文本格式。
references/core_workflow.md
满足以下任一即激活本 Skill:
调用脚本、格式化输出前,必须先读取并严格遵循 references/core_workflow.md 全文。核心原则:
./抖音_优化文案_{随机6位数字}.txt 并以卡片形式发送给用户,禁止省略
A: 已内置英文误匹配过滤。脚本会自动识别并过滤英文单词内部子串误标(如 "Glasswing" 中的 "ass"),无需额外处理。
Q8: 文件或网页提取失败?
A: 请检查文件格式是否正确、网址是否可正常访问。PDF 文件不支持,请先转换为图片或文本格式。
references/core_workflow.md
满足以下任一即激活本 Skill:
调用脚本、格式化输出前,必须先读取并严格遵循 references/core_workflow.md 全文。核心原则:
./抖音_优化文案_{随机6位数字}.txt 并以卡片形式发送给用户,禁止省略
共 1 个版本