← 返回
未分类 Key

Chinese Sensitive Words

Chinese sensitive word detection and content compliance checker (中文敏感词/违禁词检测). Scan text for banned, restricted, and risky words across Xiaohongshu (小红书), Do...
Chinese sensitive word detection and content compliance checker (中文敏感词/违禁词检测). Scan text for banned, restricted, and risky words across Xiaohongshu (小红书), Do...
cccpan cccpan 来源
未分类 clawhub v1.0.5 1 版本 99836.3 Key: 需要
★ 0
Stars
📥 610
下载
💾 11
安装
1
版本
#bilibili#chinese#content-moderation#douyin#latest#sensitive-words#stable#xiaohongshu

概述

中文敏感词检测工具

检测中文文本中的敏感词/违禁词,支持小红书、抖音、快手、B站等主流平台。

快速开始

cd scripts/

# 检测文案中的敏感词
./check.sh "这是全网最好用的美白产品,效果立竿见影"

# 查询某个词的安全替换建议
./suggestions.sh "美白"

# 查询全部替换建议库
./suggestions.sh

功能特点

  • 海量词库 — 10万+词条,每日更新,覆盖政治、色情、暴力、赌博、毒品、广告法极限词、医疗功效词等
  • 多平台支持 — 小红书、抖音、快手、B站专属词库
  • 风险分级 — 🔴 高危(封号)/ 🟡 中危(限流)/ 🔵 低危(建议修改)/ 💡 提示
  • 替换建议 — 不只检测,还推荐安全替代词
  • 智能识别 — 谐音变体(薇信→微信)、跳字(加 微 信)、手机号/URL 检测
  • NER 过滤 — 智能过滤地名、人名、机构名,减少误报

命令参考

check.sh — 检测敏感词

检测文本中的敏感词/违禁词,返回风险等级和替换建议。

# 基本用法
./check.sh "要检测的文案内容"

# 关闭 NER 过滤(更严格的检测)
./check.sh "要检测的文案内容" --no-ner

# 从文件读取
./check.sh --file input.txt

参数说明:

  • 第一个参数:要检测的文本(最大 3000 字符)
  • --no-ner:关闭 NER 智能过滤,检测更严格
  • --file <路径>:从文件读取待检测文本

输出示例:

⚠️ 检测到 4 个敏感词

风险概览: 🔴 高危=1 | 🟡 中危=2 | 🔵 低危=1

🔴 高危(可能导致封号/删帖)
  - "13812345678" — 分类: 手机号

🟡 中危(可能导致限流/降权)
  - "最好用" — 分类: 广告法极限词 → 建议替换: 很好用, 超好用
  - "美白" — 分类: 医疗功效 → 建议替换: 提亮, 焕亮

🔵 低危(建议修改)
  - "加微信" — 分类: 引流 → 建议替换: 私信咨询

suggestions.sh — 获取替换建议

查询敏感词的安全替换词。

# 查询指定词的替换建议
./suggestions.sh "美白"
./suggestions.sh "最好"

# 查询全部替换建议库(按分类展示)
./suggestions.sh

输出示例:

"美白" (医疗功效词替换)
建议替换: 提亮, 焕亮, 匀净, 透亮

配置

免费使用(每月 10 次)

无需任何配置,开箱即用。

无限使用(获取 Token)

前往 GitHub Issues 获取正式 Token。

获取后在 skill 目录下创建 .env 文件:

SENSITIVE_WORDS_TOKEN=your_token_here

或设置环境变量:

export SENSITIVE_WORDS_TOKEN=your_token_here

默认 API 服务

本工具默认使用以下 API 服务进行敏感词检测:

https://www.xdhdancer.top/api8888

该服务由本项目维护,仅用于敏感词检测,不会存储或分享您的文本内容。

自定义服务地址

如果使用私有部署的检测服务:

SENSITIVE_WORDS_API_BASE=https://your-server.com/api
SENSITIVE_WORDS_TOKEN=your_token_here

使用额度

类型额度说明
------------------
免费(无 Token)10 次/月开箱即用,无需注册
注册用户(有 Token)无限制获取 Token

支持的平台词库

平台词库内容
----------------
通用政治、色情、暴力、赌博、毒品、违法
小红书广告法极限词、医疗功效、虚假宣传、焦虑营销、品牌词
抖音直播违禁词、引流词、夸大宣传
快手社区规范违禁词
B站社区规范、内容审核词

风险等级说明

等级影响示例
------------------
🔴 高危封号/删帖政治敏感、色情、暴力、手机号
🟡 中危限流/降权广告法极限词、医疗功效、虚假宣传
🔵 低危建议修改引流词、促销词
💡 提示注意措辞焦虑营销、容貌身材相关

故障排除

"Rate limit exceeded" 错误:

  • 免费额度已用完(每月 10 次),明天会重置
  • 或前往 GitHub Issues 获取 Token,享受无限使用

"Connection timeout" 错误:

  • 检查网络连接
  • 如果使用自定义服务地址,确认地址可访问

检测结果不准确:

  • 尝试关闭 NER 过滤(--no-ner),获得更严格的检测结果
  • NER 过滤默认开启,会自动排除地名、人名等误报

许可证

MIT

版本历史

共 1 个版本

  • v1.0.5 当前
    2026-03-30 11:37 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

content-creation

humanizer-zh

liuxy951129-cpu
去除文本中的 AI 生成痕迹。适用于编辑或审阅文本,使其听起来更自然、更像人类书写。 基于维基百科的"AI 写作特征"综合指南。检测并修复以下模式:夸大的象征意义、 宣传性语言、以 -ing 结尾的肤浅分析、模糊的归因、破折号过度使用、三段
★ 58 📥 28,876
ai-agent

Skill Development Guide / Skill 开发指南,tutorial, guide, skill, development, openclaw, qclaw, ai, mcp, how-to, 教程, 开发指南, skill-builder, clawhub

cccpan
在ClawHub和OpenClaw平台上构建可复用AI技能的综合教程,包含详细说明、脚本、安全最佳实践和示例。
★ 0 📥 483
content-creation

Marketing Skills

jchopard69
{"answer":"获取23个营销模块,包含CRO、SEO、文案、分析、发布、广告及社媒的清单、框架与现成交付物。"}
★ 142 📥 30,621