← 返回
未分类

内容审核专家

AI生成内容通用审校工具(反污染增强版)。核心特色:三层防污染隔离体系,解决互联网信息投毒+AI数据污染问题。 三大模块:数据验证(反污染专项+真实性+时效性)+ 逻辑验证(IRAC框架)+ 文风验证(AI去味)。 适用场景:专利知识产权领域内容审校、法律文书质量把控、公众号文章核查、专业报告审校。 风险分级:一级致命(投毒)/二级严重(污染)/三级提示(轻度)
|AI生成内容通用审校工具,提供数据验证、逻辑验证、文风验证三大模块,内置反污染双层防御体系,专为专利情报、法律文书等高公信力要求的内容设计。
patentfish
未分类 community v1.0.0 1 版本 99122.8 Key: 无需
★ 1
Stars
📥 93
下载
💾 0
安装
1
版本
#latest

概述

Content Audit - AI生成内容通用审校技能

> 核心定位:专业领域AI生成内容的"质检员"

> 三大模块:数据验证 + 逻辑验证 + 文风验证

> 解决痛点:数据失真、逻辑不严谨、文风模板化


一、技能概述

背景与痛点

AI生成内容在专业领域存在三大核心问题:

问题类型具体表现严重程度
------------------------------
数据失真专利号虚构、著录项矛盾、法条过时、判例失效
逻辑不严谨论证不完整、因果跳跃、结论无依据
文风模板化AI套路表述、生硬衔接、空泛套话

技能定位

本工具聚焦专业领域(尤其是专利知识产权领域)AI生成内容的合规性、准确性、专业性审校,采用模块化架构

核心特色:反网络信息投毒与AI数据污染专项设计

针对互联网大规模人为信息投毒+全网AI次生数据污染问题,建立三层防污染隔离体系:

  • 第一层:可信不可篡改官方根底库(终审锚点)
  • 第二层:污染信源黑白名单 + AI脏特征规则引擎
  • 第三层:轻量化固定三角闭环查证
┌─────────────────────────────────────────────────────────────┐
│                    内容审校工具架构(反污染增强版)          │
├─────────────────────────────────────────────────────────────┤
│                                                              │
│  ┌─────────────────────────────────────────────────────┐   │
│  │            前置反污染过滤层(新增)                  │   │
│  │  • 黑名单信源拦截    • AI脏特征识别                 │   │
│  │  • 三角闭环查证      • 官方底库终审                 │   │
│  └────────────────────────┬────────────────────────────┘   │
│                           ↓                                 │
│  ┌─────────────────┐  ┌─────────────────┐  ┌─────────────┐ │
│  │  数据验证模块   │  │  逻辑验证模块   │  │ 文风验证模块│ │
│  │                 │  │                 │  │             │ │
│  │ • 真实性验证    │  │ • IRAC框架校验  │  │ • AI味识别  │ │
│  │ • 时效性验证    │  │ • 因果逻辑校验  │  │ • 专业适配  │ │
│  │ • 一致性验证    │  │ • 充分性校验    │  │ • 风格优化  │ │
│  │ • 反污染验证    │  │                 │  │             │ │
│  └────────┬────────┘  └────────┬────────┘  └──────┬──────┘ │
│           │                    │                   │        │
│           └────────────────────┼───────────────────┘        │
│                                ↓                             │
│                    ┌─────────────────────┐                  │
│                    │   审校报告输出      │                  │
│                    │                     │                  │
│                    │ • 问题清单          │                  │
│                    │ • 风险等级(三级)  │                  │
│                    │ • 修正建议          │                  │
│                    │ • 官方溯源依据      │                  │
│                    └─────────────────────┘                  │
└─────────────────────────────────────────────────────────────┘

二、数据验证模块

2.0 反污染专项设计(核心亮点)

> 详细规则参见:references/数据验证规则.md 第六章至第八章

设计背景

当前互联网存在大规模人为信息投毒 + 全网AI次生数据污染问题,传统多方网页交叉核验会出现"全网错误一致",导致审校误判。

三层防污染隔离体系

第一层:可信不可篡改官方根底库(终审锚点)

库类型数据来源权威性
--------------------------
专利专属底库国家知识产权局官方系统终审源
法律法规底库全国人大网、国务院网、国家知识产权局终审源
司法判例底库中国裁判文书网终审源
专业数据库智慧芽、incoPat等第二权威来源(佐证源)

第二层:污染信源黑白名单 + AI脏特征规则引擎

信源类型处置方式示例
--------------------------
黑名单(永久禁用)直接剔除,不参与任何交叉比对自媒体、付费文库、AI聚合站点
白名单(辅助佐证)可参考,无判定权知识产权出版社、法院官方平台、智慧芽

第三层:三角闭环查证

源A(终审源)→ 国家法定官方原生根库 ★最终拍板★
源B(佐证源)→ 行业官方合规二次权威整编库
源C(物证源)→ 专利公开PDF、裁判文书原版扫描原生物证

校验逻辑:
- 三源一致 → 数据可信
- 两点一致、一点存疑 → 标记风险,触发人工复核
- 三者全部矛盾 → 判定深度网络投毒,强制采信源A官方数据

风险等级划分

风险等级风险类型具体表现处置方式
----------------------------------------
一级致命风险定向恶意信息投毒专利主键篡改、法条全文废止、判例已撤销🔴 强制标红禁止使用
二级严重风险数据污染/时效过期著录项多字段矛盾、新旧法条拼接混用、专利法律状态过期🟠 标注风险 + 提供修正数据
三级提示风险轻度污染非核心辅助数据细微偏差、全网轻度AI同质化次生污染🟡 给出修正建议

2.1 数据真实性验证

核心校验痛点

痛点类型具体表现示例
--------------------------
专利著录项矛盾专利号与标题不匹配CN117784818A标注为"图像处理方法",实际为"无人机控制方法"
日期信息冲突专利号与公开日期矛盾公开号为2023年开头,申请日却写2024年
权属信息冲突专利号与申请人矛盾某专利实际申请人为A公司,文中标注为B公司
非专利数据虚假虚构案例数据捏造不存在的判决、编造统计数据
法律依据虚构虚构法条依据引用不存在的司法解释条款

专利专属校验规则

规则1:专利号唯一性校验

# 专利号格式校验规则
发明专利申请号:CN + 13位数字 + A
发明专利授权号:CN + 13位数字 + B
实用新型专利号:CN + 13位数字 + U
外观设计专利号:CN + 13位数字 + S

# 示例
有效格式:CN117784818A, CN221059724U
无效格式:CN117784818(缺少类型码), CN117784818X(错误类型码)

规则2:著录项强关联校验

校验项校验逻辑数据源
--------------------------
专利号↔专利名称通过专利号查询官方数据库,比对专利名称是否一致国家知识产权局专利数据库
专利号↔申请日比对申请日是否与数据库记录一致同上
专利号↔公开日/公告日比对公开日期是否一致同上
专利号↔申请人/专利权人比对权属信息是否一致同上
专利号↔法律状态比对当前法律状态(有效/无效/终止)同上

规则3:数据一致性校验

校验项校验逻辑
------------------
前后表述一致同一专利在文中多次出现,专利号、日期、名称是否统一
数据逻辑合理申请日≤公开日≤公告日,时间顺序是否合理

通用真实性校验规则

规则1:事实性数据白名单校验

数据类型白名单来源
---------------------
法律法规全国人大官网、国务院官网
司法解释最高人民法院官网
官方公告国家知识产权局官网
权威统计官方统计年鉴、行业报告

规则2:来源溯源规则

  • 所有事实性数据必须标注来源
  • 无权威来源的数据标记为"待核实"
  • 无法验证的数据标记为"存疑"

技术落地路径

数据验证执行流程:
1. 内容解析 → 提取所有专利号、日期、名称、数据点
2. 专利号校验 → 格式验证 → 数据库查询 → 著录项比对
3. 数据溯源 → 来源识别 → 权威性判断 → 标注/标记
4. 风险分级 → 严重矛盾/一般矛盾/待核实
5. 输出结果 → 问题清单 + 修正建议 + 官方数据

2.2 数据时效性验证

核心校验痛点

痛点类型具体表现示例
--------------------------
法条过时引用已废止或修订前的旧法条引用2020年修订前的专利法条款
判例失效引用已被推翻的判例引用的判决已被再审撤销
专利状态过期将失效专利作为有效依据已终止的专利仍被引用为有效权利
数据滞后引用过期的行业数据使用2019年数据描述2026年现状

法律法规时效校验规则

规则1:法条版本时间戳规则

法规类型时间戳要素校验逻辑
-------------------------------
法律最新生效日期、修订记录引用的法条生效日期是否早于最新版本
行政法规发布日期、修订日期是否引用已废止的旧版本条款
司法解释发布日期、废止日期是否引用已失效的司法解释

规则2:专利法专项规则

法规最新版本校验要点
-------------------------
专利法2020年修正引用的条款是否为现行有效版本
专利法实施细则2023年修订条款编号是否与新版本一致
专利审查指南最新版本引用的章节/段落是否为现行版本

判例与专利时效校验规则

规则1:判例更新规则

校验项校验逻辑
------------------
审理状态判例是否为终审生效,是否被再审撤销
裁判效力是否仍有约束力,是否被后续判例推翻
指导案例地位是否为指导性案例,是否已被废止

规则2:专利法律状态时效规则

法律状态含义引用风险
--------------------------
有效专利权在保护期内可作为有效权利依据
无效专利权被宣告无效不可作为权利依据
终止专利权期限届满/放弃不可作为有效权利依据
驳回申请未获授权不可作为权利依据

规则3:时间阈值规则

数据类型时效阈值校验逻辑
-----------------------------
行业数据3年超过3年的数据需标注"需核实最新状态"
政策文件1年超过1年的政策需核实是否仍在执行
企业数据1年企业经营数据需核实最新情况

技术落地路径

时效性验证执行流程:
1. 内容解析 → 提取所有法条引用、判例引用、专利引用、时间数据
2. 法规时效校验 → 版本比对 → 有效/失效判断 → 替代版本推送
3. 判例时效校验 → 审理状态查询 → 效力判断 → 风险标记
4. 专利时效校验 → 法律状态查询 → 有效/失效判断 → 风险标记
5. 数据时效校验 → 时间阈值比对 → 滞后性标记 → 核实建议
6. 输出结果 → 过时信息清单 + 最新替代数据

三、逻辑验证模块

3.1 IRAC框架强制校验

> 适用范围:仅适用于微信公众号文章且与知识产权法条高相关的撰写

> 其他内容类型使用通用逻辑校验即可

IRAC框架是法律论证的标准结构,专利法相关内容必须符合此框架:

I - Issue(问题)    → 明确争议焦点
R - Rule(规则)     → 引用法律依据
A - Application(应用)→ 结合事实分析
C - Conclusion(结论)→ 得出判断结论

IRAC四要素校验规则

要素1:Issue(问题界定)

校验项合格标准不合格表现
-----------------------------
问题明确性清晰界定核心争议未提出问题或问题模糊
问题针对性针对具体法律争议问题过于宽泛或偏离主题
问题完整性涵盖所有关键争议点遗漏重要争议问题

要素2:Rule(规则引用)

校验项合格标准不合格表现
-----------------------------
法条准确性引用准确的法条原文引用错误或不存在的法条
法条相关性法条与争议问题高度相关法条与问题脱节
法条完整性引用完整的条款内容断章取义或遗漏关键限定

要素3:Application(事实应用)

校验项合格标准不合格表现
-----------------------------
事实匹配法条与案例事实紧密结合法条与事实脱节
分析深度针对性分析具体特征仅做概括性陈述
论证充分逐项分析关键特征遗漏重要特征分析

要素4:Conclusion(结论推导)

校验项合格标准不合格表现
-----------------------------
逻辑一致结论与前文论证一致结论与论证矛盾
依据充分结论有论证过程支撑结论无依据或依据不足
表述准确使用规范法律表述表述不准确或歧义

IRAC框架审核清单

【IRAC框架审核清单】

□ Issue:是否明确提出核心争议问题?
□ Rule:是否引用对应的法律法规?
□ Rule:法条引用是否与问题匹配?
□ Application:是否结合具体事实分析?
□ Application:分析是否充分、有针对性?
□ Conclusion:结论是否与论证一致?
□ Conclusion:结论是否有充分依据?

3.2 通用逻辑校验规则

因果逻辑校验

校验项问题表现校验逻辑
----------------------------
因果跳跃中间缺失推理环节检查因果关系链条是否完整
倒置因果混淆原因与结果检查因果方向是否正确
相关性误判混淆相关与因果区分相关关系与因果关系

论点一致性校验

校验项问题表现校验逻辑
----------------------------
前后矛盾前文观点与后文矛盾比对全文论点是否一致
偷换概念同一概念前后含义不同检查关键概念的内涵一致性
范围漂移论证范围前后不一致检查论证对象是否保持一致

论证充分性校验

校验项问题表现校验逻辑
----------------------------
论据不足论点缺乏足够支撑检查每个论点是否有充分论据
论证缺失仅陈述观点不论证检查是否有论证过程
反例忽略未考虑反驳观点检查是否回应潜在反驳

四、文风验证模块

4.1 AI文风特征识别

AI典型文风特征库

类别1:套路化衔接词

特征词/句式问题说明优化方向
---------------------------------
"值得注意的是..."AI高频使用的转折衔接改为直接陈述或删除
"综上所述..."模板化总结开头改为直接总结或删减
"首先...其次...最后..."机械式列举结构打散结构,自然过渡
"由此可见..."生硬的推导衔接改为直接表达因果关系
"不得不提的是..."冗余的强调句式直接陈述要点

类别2:空泛套话

套话类型问题示例优化方向
------------------------------
空洞评价"具有重要意义"具体说明是什么意义
虚假强调"至关重要"删除或用具体影响替代
模糊预测"或将带来深远影响"具体说明可能的影响
过度修饰"前所未有的技术变革"删除修饰词,客观陈述

类别3:冗余表述

冗余类型问题示例优化方向
------------------------------
重复强调多次使用相同表述精简合并
废话铺垫过长的背景铺垫删除冗余,直入主题
循环论证用不同方式重复同一观点保留一个版本

类别4:生硬表达

问题类型问题示例优化方向
------------------------------
名词堆砌过多术语堆砌拆解为通俗表述
被动语态滥用"被广泛应用于"改为主动语态
长句过多超过50字的长句拆分为短句

4.2 专业文风适配规则

专利领域文风规范

规范项要求示例
--------------------
术语准确使用规范专利术语"权利要求"而非"专利权利书"
法条引用规范引用完整条款号"《专利法》第二十二条第三款"
案例引用规范标注完整案号"(2024)最高法知行终141号"
表述严谨避免绝对化表述用"通常""一般"替代"必然""一定"

法律文书文风规范

规范项要求
--------------
客观中立不使用情绪化表述
逻辑清晰论点论据层次分明
用词精准法律术语使用准确
简洁有力避免冗余修饰

4.3 文风优化执行流程

文风优化执行流程:
1. 内容扫描 → 识别AI文风特征
2. 特征分类 → 套路化/空泛/冗余/生硬
3. 风险标记 → 高频AI特征重点标记
4. 优化建议 → 提供具体修改方案
5. 专业适配 → 按领域规范调整
6. 输出结果 → 优化后版本 + 修改说明

五、审校报告输出规范

5.1 审校报告结构

# 内容审校报告

## 一、审校概况
- 审校对象:[文件名/标题]
- 审校范围:数据验证 + 逻辑验证 + 文风验证
- 问题总数:X个(严重X个,一般X个,轻微X个)

## 二、数据验证结果

### 2.1 真实性问题
| 序号 | 问题类型 | 原文内容 | 问题说明 | 修正建议 | 风险等级 |
|------|----------|----------|----------|----------|----------|

### 2.2 时效性问题
| 序号 | 问题类型 | 原文内容 | 问题说明 | 最新数据 | 风险等级 |
|------|----------|----------|----------|----------|----------|

## 三、逻辑验证结果

### 3.1 IRAC框架问题
| 要素 | 问题说明 | 修正建议 |
|------|----------|----------|

### 3.2 其他逻辑问题
| 序号 | 问题类型 | 原文位置 | 问题说明 | 修正建议 |
|------|----------|----------|----------|----------|

## 四、文风验证结果

### 4.1 AI文风特征
| 序号 | 特征类型 | 原文内容 | 问题说明 | 优化建议 |
|------|----------|----------|----------|----------|

## 五、优化后版本

[提供优化后的完整内容]

## 六、核查依据

[列出核查使用的数据源、法规版本等]

六、使用流程

步骤1:内容导入

上传AI生成的内容文件(支持Markdown/Word/纯文本)

步骤2:前置反污染过滤(新增)

在模块审校前,先执行反污染过滤:
1. 信源识别 → 判断内容来源是否在黑名单
2. AI脏特征扫描 → 识别模板套话、同质化表述
3. 三角闭环查证 → 官方底库终审 + 权威佐证 + 原始物证
4. 风险分级 → 一级致命/二级严重/三级提示

步骤3:模块审校

依次启动:
1. 数据验证模块(真实性 + 时效性 + 反污染验证)
2. 逻辑验证模块(IRAC + 通用逻辑)
3. 文风验证模块(AI特征 + 专业适配)

步骤4:风险标记

自动标记所有问题点,标注三级风险等级:
- 一级致命:强制禁止使用(专利主键篡改、法条废止、判例撤销)
- 二级严重:必须修正(数据错误、法条过时、著录项矛盾)
- 三级提示:建议修正(逻辑不严谨、AI文风、冗余表述)

步骤5:报告输出

生成完整审校报告,包含:
- 问题清单
- 三级风险等级
- 修正建议
- 官方溯源依据(来自哪个官方底库)
- 优化后版本

步骤6:人工修正

用户基于报告完成内容优化,可二次审校验证

七、参考文档索引

规则文档

模板文件

外部数据源

  • 国家知识产权局专利数据库:https://pss-system.cponline.cnipa.gov.cn/
  • 最高人民法院裁判文书库:https://wenshu.court.gov.cn/
  • 全国法律法规数据库:https://flk.npc.gov.cn/

八、技能边界

  1. 数据验证局限:依赖公开数据库,部分内部数据无法验证
  2. 逻辑验证局限:无法判断观点本身的正确性,仅校验论证结构
  3. 文风验证局限:专业程度判断需结合具体领域知识
  4. 人工复核必要性:高风险内容建议人工最终确认

九、反污染设计局限与应对

9.1 局限性说明

局限类型具体表现应对措施
------------------------------
官方底库同步延迟刚修法/最新判例未同步高危可疑池人工兜底
跨国专利著录项多国数据库差异核对多国官方数据
小众特殊专利业务数据库覆盖不完整查阅原始专利文件
AI新型污染模式特征库未覆盖规则正向反哺迭代

9.2 人工兜底机制

针对以下场景,机器无法自动判定,统一划入高危可疑池,禁止自动通过,由专业人工终审:

  • 刚修法未同步底库
  • 最新未归档判例
  • 小众特殊专利业务
  • 跨国专利著录项

9.3 规则迭代机制

每次人工复核发现新型网络投毒手法、新型AI数据污染模式:

  1. 标准化固化为硬规则
  2. 更新特征库与规则引擎
  3. 提升自动化拦截准确率

十、持续迭代机制

  1. 规则更新:根据法规修订、校验误差持续优化规则
  2. 特征库扩充:持续积累AI文风特征案例 + AI污染特征库
  3. 数据源扩展:接入更多权威数据源
  4. 用户反馈:收集用户反馈优化审校效果
  5. 反污染规则迭代:人工复核发现新型投毒手法,固化为硬规则

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-05-07 11:10 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 670 📥 324,316
security-compliance

Skill Vetter

spclaudehome
AI智能体技能安全预审工具。安装ClawdHub、GitHub等来源技能前,检查风险信号、权限范围及可疑模式。
★ 1,217 📥 266,660
ai-intelligence

Self-Improving + Proactive Agent

ivangdavila
自我反思+自我批评+自我学习+自组织记忆。智能体评估自身工作、发现错误并持续改进。
★ 1,362 📥 318,703