> 核心理念:CT三步法 —— 穿透→诊断→处方
>
> 像医院CT扫描仪一样,对学术论文做穿透式七维深度扫描,不只找问题,更给出精准修复处方。
> 一句话交给AI,全自动完成全部检测,你只看报告和改稿。
第一步:穿透扫描(7个维度并行)
↓ 提取全文 → 数据索引 → 特征分析 → 交叉验证
第二步:综合诊断(加权评分+等级判定)
↓ 七维独立评分 → 加权总分 → 风险等级 → 智能排序
第三步:精准处方(优先修复清单+具体建议)
↓ 按严重程度排列 → 逐项给修改方向 → 预防复发建议
这不是一个"检查工具",而是一套完整的「论文健康管理系统」。
当用户说以下任意一句话时,触发本Skill并自动执行全部流程:
> "帮我检测这篇论文" / "论文有问题吗" / "投稿前检查一下" / "用论文CT扫一下"
1. 接收输入(文件路径 / 文件夹 / 粘贴文本 / IMA附件)
↓
2. 调用主控引擎:
python scripts/paper_ct_scan.py --input <路径> --output output/
↓
3. 引擎自动执行7个检测模块,生成3份输出文件
↓
4. AI读取 report_summary.md,整理成用户友好的摘要呈现
↓
5. 附带「优先修复清单」和「预防建议」
| 文件 | 用途 | 谁看 |
|---|---|---|
| ------ | ------ | ------ |
output/report_summary.md | 完整检测报告(人类可读) | 用户 |
output/report_detail.json | 结构化详细数据(程序可读) | 开发/二次处理 |
output/scores.json | 七维评分+总分+等级 | 快速概览 |
| # | 维度 | 权重 | 核心问题 | 不通过后果 |
|---|---|---|---|---|
| --- | ------ | ------ | --------- | ----------- |
| 1 | 📐 排版规范 | 10% | 字体/标题/行距/图表编号/参考文献GB/T 7714 | 第一印象差,初审易被退 |
| 2 | 🔎 内容真实 | 25% | 数据出处/引用存在性/前后一致性 | 最致命——直接拒稿 |
| 3 | ⚙️ 可行性 | 15% | 方法合理性/样本量/时间线/资源匹配 | 审稿人质疑研究设计 |
| 4 | 🧠 内容真伪 | 15% | 事实交叉验证/统计合理/逻辑谬误 | 学术信誉受损 |
| 5 | 🤖 AI痕迹 | 15% | 段落均匀度/空洞语言/公式化过渡/虚构引用 | 越来越被编辑部重视 |
| 6 | 📋 学术规范 | 10% | 抄袭迹象/伦理合规/文献完整/基金披露 | 基本底线,不达标必退 |
| 7 | 🎯 期刊适配 | 10% | 方向匹配/字数合规/级别对等/结构完整 | 投稿命中率低 |
╔══════════════════════════════════════════╗
║ 📋 论文CT检测报告 ║
╠══════════════════════════════════════════╣
║ 论文:《气排球大单元教学实践研究》 ║
║ 总评分:78.5/100 ✅ 良好 ║
║ 🔴 严重:2项 🟡 注意:5项 🟢 通过:— ║
╠══════════════════════════════════════════╣
║ 📐 排版规范:82/100 🟢 ║
║ 🔎 内容真实:65/100 🟡 ← 重点修复 ║
║ ⚙️ 可行性: 88/100 🟢 ║
║ 🧠 内容真伪:75/100 🟡 ║
║ 🤖 AI痕迹: 91/100 🟢 ║
║ 📋 学术规范:70/100 🟡 ║
║ 🎯 期刊适配:85/100 🟢 ║
╠══════════════════════════════════════════╣
║ ⚡ TOP3 优先修复: ║
║ 1. 🔴 [内容真实] 样本量前后不一致 ║
║ 2. 🔴 [内容真实] 引用文献疑似虚构 ║
║ 3. 🟡 [学术规范] 正文缺少引用标记 ║
╚══════════════════════════════════════════╝
| 不能做的事 | 原因 | 建议替代方案 |
|---|---|---|
| ----------- | ------ | ------------- |
| 查重检测(对比已有文献库) | 需要海量数据库支持 | 知网查重 / 维普查重 |
| 语法/错别字校正 | 不是本系统定位 | WPS审阅模式 / 秘塔写作 |
| 英文论文润色 | 当前专注中文学术论文 | Grammarly / DeepL |
| 替你改写论文 | 只诊断不开药方是原则 | 根据报告自行修改 |
| 保证发表论文 | 检测≠录用,质量是基础 | 结合报告修改后投稿 |
| 检测非学术文本(小说/公文/合同) | 检测规则专为学术论文设计 | 不适用 |
pip install python-docx pdfplumber chardet本Skill的硬性原则:异常绝不静默跳过。
所有检测模块遵循统一的异常全景报告机制:
每份报告末尾附带 操作日志,记录实际执行的步骤和跳过的原因。
Q1: 这个Skill安全吗?会泄露我的论文吗?
A: 绝对安全。所有检测在本地完成,论文内容不会上传到任何服务器。不联网、不注册、不留痕。隐私声明见上方。
Q2: 需要安装什么软件?
A: 只需要 Python 3.8+ 和三个轻量包。一行命令搞定:pip install python-docx pdfplumber chardet。没有其他依赖。
Q3: 支持哪些文件格式?
A: .docx(Word文档)、.pdf(PDF文档)、.txt(纯文本)、.md(Markdown)。推荐用 .docx 格式,信息保留最完整。
Q4: 检测一篇论文大概要多久?
A: 通常 5-15 秒(取决于论文字数和文件格式)。PDF 稍慢因为需要解析,纯文本最快。
Q5: 检测失败了怎么办?
A: 报告会明确告诉你哪一步失败、为什么失败。常见原因:(1)依赖没装 → 运行 pip 安装;(2)文件编码特殊 → 尝试另存为 UTF-8;(3)文件损坏 → 用原软件打开重新保存。
Q6: 和知网查重有什么区别?
A: 完全不同。知网查重是对比已有文献库看是否重复;论文CT是从论文自身内部逻辑检测问题(数据矛盾、AI痕迹、格式规范等)。两者互补,建议都做。
Q7: 为什么检测结果和我预期不一样?
A: 论文CT基于规则引擎+统计分析,不是人工审稿。它擅长发现客观性问题(格式错误、数据矛盾、AI特征),但对主观性问题(创新性、论证深度)只能给出参考意见。分数低不代表一定不能发表,分数高也不代表一定能发。
Q8: 能检测英文论文吗?
A: 当前版本主要针对中文学术论文设计(如 GB/T 7714 参考文献格式、中文AI填充词库等)。英文论文可以尝试使用,但部分检测维度(如中文术语一致性、中文AI填充词)会降级或跳过。
Q9: 如何只检测某一个维度?
A: 可以单独调用对应模块,例如只检测AI痕迹:python scripts/ai_detect.py --input 论文路径 --output output/。但通常建议全量检测,因为各维度之间有关联(如数据矛盾同时影响真实性和真伪两个维度)。
Q10: 分数多少算合格?
A: 参考标准:90+优秀(可直接投稿)、75-89良好(小修即可)、60-74合格(需针对性修改)、40-59需改进(有退稿风险)、<40不合格(建议大改或重写)。注意:内容真实性(25%权重)如果低于60分,无论总分多高都要重点关注。
| 等级 | 分数区间 | 含义 | 建议 |
|---|---|---|---|
| ------ | --------- | ------ | ------ |
| 🏆 优秀 | 90-100 | 质量高,可直接投稿 | 检查「提示」级问题即可 |
| ✅ 良好 | 75-89 | 整体不错,有小瑕疵 | 修复「注意」「严重」级问题 |
| 🟡 合格 | 60-74 | 达基本线但有明显短板 | 重点修复「严重」级问题 |
| ⚠️ 需改进 | 40-59 | 存在较多问题 | 建议大幅修改后复检 |
| ❌ 不合格 | 0-39 | 质量未达发表标准 | 建议重写或寻求专业帮助 |
| 维度 | 权重 | 设计理由 |
|---|---|---|
| ------ | ------ | --------- |
| 内容真实 | 25% | 最核心——数据和引用造假是学术红线,一票否决 |
| 可行性 | 15% | 研究设计站不住脚,再好的数据也没意义 |
| 内容真伪 | 15% | 事实错误直接损害学术可信度 |
| AI痕迹 | 15% | 编辑部越来越重视,趋势性指标 |
| 排版规范 | 10 | 影响第一印象,但相对容易修正 |
| 学术规范 | 10 | 基本底线要求 |
| 期刊适配 | 10 | 决定投稿命中率 |
| 版本 | 日期 | 变更 |
|---|---|---|
| ------ | ------ | ------ |
| v2.0 | 2026-06-02 | TRACE全面升级:CT三步法方法论+FAQ(10个)+反模式(5个)+隐私声明+能力边界+异常全景报告+输出样例+操作日志+环境要求声明 |
| v1.0 | 2026-06-01 | 首版发布:七维检测引擎完整实现 |
共 3 个版本