← 返回
未分类

文档审核

通用文档审核工具,检测逻辑冲突、事实冲突、文字错误、逻辑混乱等问题,支持 Word、PDF、PPT、TXT 等格式。
通用文档审核工具,检测逻辑冲突、事实冲突、文字错误、逻辑混乱等问题,支持 Word、PDF、PPT、TXT 等格式。
qiuqiu
未分类 community v1.0.0 1 版本 100000 Key: 无需
★ 1
Stars
📥 244
下载
💾 11
安装
1
版本
#latest

概述

文档审核技能 (General Document Review)

概述

本技能对任意类型的文档进行审核,聚焦四大核心问题

问题类型说明优先级
------------------------
逻辑冲突前后矛盾、论述打架、论据与结论不一致
事实冲突数据矛盾、时间线错误、引用来源冲突
文字错误错别字、语病、标点错误、格式不一致
逻辑混乱结构散乱、论证跳跃、归因谬误、重复冗余

适用文档类型

文档类型示例
----------------
技术文档技术方案、设计文档、接口文档
商务文档投标文件、合同、协议、报价单
研究报告市场分析、行业报告、可行性研究
内容稿件新闻稿、宣传文、公众号文章
学术论文毕业论文、研究报告、文献综述
日常文档邮件、备忘录、会议纪要、规章制度

使用流程

1. 快速文件定位

目标:找到并确认文件可访问。

步骤1:获取文件路径

  • 完整路径(如 D:\文档\技术方案.docx
  • 或仅文件名(如 项目报告.pdf
  • 或关键词(如 投标书

步骤2:搜索文件

# Windows PowerShell
Get-ChildItem -Path . -Recurse -Include *.docx,*.pdf,*.pptx,*.txt,*.md -ErrorAction SilentlyContinue | Where-Object { $_.Name -like "*关键词*" } | Select-Object FullName, LastWriteTime

步骤3:验证文件可访问

# 快速检查文件
Test-Path "文件路径"
(Get-Item "文件路径").Length / 1KB

2. 提取文档内容

Word 文档(.docx)

pip install python-docx
python -c "
from docx import Document
doc = Document('document.docx')
for para in doc.paragraphs:
    text = para.text.strip()
    if text:
        print(text)
for table in doc.tables:
    for row in table.rows:
        cells = [cell.text.strip() for cell in row.cells if cell.text.strip()]
        if cells:
            print(' | '.join(cells))
"

PDF 文档

pip install pymupdf
python -c "
import fitz
doc = fitz.open('document.pdf')
for i, page in enumerate(doc):
    text = page.get_text()
    if text.strip():
        print(f'=== 第 {i+1} 页 ===')
        print(text)
"

PPT 文档(.pptx)

pip install python-pptx
python -c "
from pptx import Presentation
prs = Presentation('document.pptx')
for i, slide in enumerate(prs.slides):
    print(f'\\n=== 第 {i+1} 页 ===')
    for shape in slide.shapes:
        if hasattr(shape, 'text') and shape.text.strip():
            print(shape.text.strip())
"

纯文本(.txt / .md)

Get-Content "document.txt" -Raw

3. 执行审核

3.1 逻辑冲突检查

定义:文档内部或与已知事实存在自相矛盾的表述。

常见类型:

类型示例检查方法
----------------------
前后矛盾前文说"功能A已上线",后文说"功能A计划开发"对比全文相同关键词的表述
论据与结论矛盾论据支持方案A,结论却选了方案B检查论证链条
条件矛盾"必须"和"可选"同时出现在同一要求检查约束条件表述
范围矛盾标题说"全面",内容只覆盖部分对比承诺与实际
时间矛盾里程碑时间倒置检查时间线逻辑

检查命令:

# 提取文档后,用 AI 模型进行逻辑冲突分析
# 提示词:
# "请仔细阅读以下文档,标注所有逻辑冲突:
# 1. 前后矛盾的表述(需列出矛盾的两个位置)
# 2. 论据与结论不一致的地方
# 3. 条件或约束相互冲突的地方
# 格式:[冲突位置] 矛盾描述"

3.2 事实冲突检查

定义:与可靠来源或客观事实明显不符的表述。

常见类型:

类型示例检查方法
----------------------
数据矛盾前文"市场份额30%",后文"25%"对比全文数据一致性
时间错误日期早于事件发生时间核查时间线
引用错误引用的法规、标准已废止核实引用来源时效
名称错误人物/公司/产品名称不匹配交叉验证
常识冲突明显违背基本常识的数据结合领域知识判断

核查优先级:

  1. :涉及法律合规的数据(法规、标准、认证)
  2. :涉及财务数据(收入、人数、比例)
  3. :涉及时间节点和里程碑
  4. :涉及人名、公司名、产品名
  5. :涉及一般性描述和形容词

3.3 文字错误检查

常见类型:

类型示例检查方法
----------------------
错别字"已得"应为"赢得","象限"应为"选项"逐字排查高频错别字
语病"由于...因此..."句式残缺语法分析
标点错误逗号句号混用、引号不匹配标点一致性检查
格式不一致同一术语有多种写法术语统一性检查
繁简混用正文中繁简不统一全局搜索
数字用法"一"和"1"混用、"1990年代"vs"1990s"数字格式统一

高频错别字参考表:

已得→赢得 / 象限→选项 / 决对→绝对 / 布署→部署
事绩→业绩 / 收届→受到 / 桃战→挑战 / 邦定→绑定
针对于→针对 / 大大的→大大 / 简单点→简单点(口语)

3.4 逻辑混乱检查

常见类型:

类型示例检查方法
----------------------
结构散乱同一话题分散在多个章节检查段落主题集中度
论证跳跃A→C 缺少 B 作为过渡检查论证链条
归因谬误相关性当作因果性检查因果关系表述
重复冗余同一内容反复出现检查重复段落
归类不清不同层级内容混放检查标题层级
主语不清句子主语频繁切换检查代词指代

4. 生成审核报告

# 文档审核报告

**审核文档**: [文档名称]
**审核时间**: YYYY-MM-DD HH:mm
**文档类型**: [技术方案/商务文档/研究报告/etc.]
**文档规模**: XX页 / XX字

---

## 📊 问题概览

| 问题类型 | 数量 | 严重程度 |
|----------|------|----------|
| 逻辑冲突 | X | [高/中/低] |
| 事实冲突 | X | [高/中/低] |
| 文字错误 | X | [高/中/低] |
| 逻辑混乱 | X | [高/中/低] |
| **合计** | **X** | — |

---

## 🔍 逻辑冲突

### 位置:[第X页 / 标题]

**问题描述**:
[矛盾的具体表述]

**冲突分析**:
- 冲突点A:[内容]
- 冲突点B:[内容]
- 矛盾原因:[分析]

**修改建议**:
[具体修改方案]

---

## 🔍 事实冲突

### 位置:[第X页 / 标题]

**问题描述**:
[与事实不符的具体表述]

**事实依据**:
[正确的客观事实]

**修改建议**:
[具体修改方案]

---

## 🔍 文字错误

### 错别字

| 位置 | 错误 | 正确 | 说明 |
|------|------|------|------|
| 第X页 | [错误字] | [正确字] | [原因] |

### 语病

| 位置 | 问题句子 | 修改建议 |
|------|----------|----------|
| 第X页 | [病句] | [修改后] |

### 标点/格式问题

| 位置 | 问题 | 修改建议 |
|------|------|----------|
| 第X页 | [问题描述] | [修改建议] |

---

## 🔍 逻辑混乱

### 位置:[第X页 / 标题]

**问题类型**:[结构散乱/论证跳跃/归因谬误/etc.]

**问题描述**:
[混乱的具体表现]

**修改建议**:
[具体修改方案]

---

## 💡 综合改进建议

### 高优先级(必须修改)

1. [最重要的问题及修改方案]

### 中优先级(建议修改)

2. [次要问题及修改方案]

### 低优先级(可选优化)

3. [小问题或风格优化]

---

## 📋 问题清单汇总

| # | 类型 | 位置 | 问题简述 | 优先级 |
|---|------|------|----------|--------|
| 1 | 逻辑冲突 | 第X页 | [简述] | 高 |
| 2 | 事实冲突 | 第X页 | [简述] | 高 |
| 3 | 文字错误 | 第X页 | 错别字:[字] | 中 |

---

## 🎯 总结

### 整体评价

[对文档进行整体评价,100字以内]

### 建议

- ✅ **建议**:**[修改后可直接使用/需重大修改后使用]**
- 📝 **主要问题**:**[最需要优先解决的一到两个问题]**

问题严重程度分级

等级说明处理建议
----------------------
严重影响文档可信度或合规性,如事实性数据错误、法规引用错误、核心结论自相矛盾必须修改
影响文档专业性或阅读体验,如次要段落逻辑混乱、少量错别字、格式不统一建议修改
轻微问题,如表述可更精炼、个别用词可优化可选修改

审核技巧

快速定位问题

  1. 数据交叉验证:全文搜索同一数据,对比是否一致
  2. 时间线梳理:提取所有时间节点,核查顺序是否合理
  3. 术语统一检查:提取文档中所有专业术语,确认写法统一
  4. 标题层级检查:检查 H1/H2/H3 是否逐级包含、无跳跃
  5. 代词指代检查:确认"它/这/那"等指代明确

常用搜索命令

# 搜索文档中某术语出现的位置
Select-String -Path "*.docx" -Pattern "关键词" -Recurse

# 搜索矛盾表述(如同时出现"必须"和"可选")
Select-String -Path "*.docx" -Pattern "必须" -Recurse
Select-String -Path "*.docx" -Pattern "可选" -Recurse

AI 辅助审核提示词

# 逻辑冲突检测提示词
请仔细阅读以下文档,逐一标注所有逻辑冲突:
- 前后矛盾的表述(列出矛盾双方及各自位置)
- 论据与结论不一致的地方
- 同一约束条件相互矛盾的地方
输出格式:[位置] 矛盾描述

# 事实冲突检测提示词
请核查以下文档中的事实陈述,重点检查:
- 涉及数据的内容(比例、金额、人数)
- 涉及时间的内容(日期、期限)
- 涉及法规标准的内容(法规名称、条款号)
如发现与客观事实不符,请标注。
输出格式:[位置] 问题描述 | 正确事实

# 文字错误检测提示词
请检查以下文档的文字错误:
- 错别字
- 语法病句
- 标点符号错误
- 格式不统一(如繁简混用、数字格式不统一)
输出格式:[位置] 错误内容 | 修改建议

依赖项

# Word处理
pip install python-docx

# PDF处理
pip install pymupdf

# PPT处理
pip install python-pptx

注意事项

  1. 客观中立:审核时保持客观,避免主观偏好影响判断
  2. 有据可查:事实冲突需注明依据(来源/法规/常识)
  3. 明确位置:每个问题需标注具体位置(页码/章节/段落)
  4. 可操作建议:修改建议需具体可执行
  5. 区分优先级:避免将所有问题都列为高优先级
  6. 尊重原文意图:修改建议应保留原文核心意思

版本历史

  • v6.0 (2026-04-22) - 通用审核版本:
  • 聚焦四大核心问题:逻辑冲突、事实冲突、文字错误、逻辑混乱
  • 移除行业专项审核内容,改为通用文档审核
  • 新增问题严重程度分级
  • 新增常用审核技巧和AI提示词
  • 简化报告模板,更快定位问题
  • v5.0 (2026-03-19) - 知识共建激励版本
  • v4.0 (2026-03-19) - 竞品分析专项版本
  • v3.0 (2026-03-07) - 快速定位优化版本
  • v2.0 (2026-03-07) - 功能完善版本
  • v1.0 - 初始版本

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-04-22 11:01 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

网页图片批量下载

user_0c7f1934
网页图片下载器。输入任意网站地址,自动提取并下载该网页上所有的图片。 当用户说"下载网页图片"、"下载这个网站的所有图片"、"批量下载图片"、 "下载网页上的图片"、"帮我把这个页面的图片都下下来"时触发。 支持 JPG、PNG、GIF、W
★ 0 📥 164

股票持仓分析

user_0c7f1934
持仓分析技能。当用户发送股票名称、股票代码、持仓分析、个股分析、分析某某股票时,对股票的财务、基本面、行业趋势、供需关系、国家政策、地缘影响等多维度分析。适用于投资决策、持仓检视、股票调研等场景。
★ 2 📥 265

qiuqiu-长报告撰写-v4.0.0-zh

user_0c7f1934
超长可行性研究报告多Agent协作撰写系统。Phase 0 需求确认 → Phase 1 规划师输出大纲 → Phase 2 分批并行子Agent撰写 → Phase 2.5 跨章一致性审查 → Phase 3 整合师汇总输出精美 docx
★ 1 📥 163