← 返回
未分类

paper-format-check

论文格式合规检查工作流。先询问用户是否有格式要求文件(5种来源),再确定论文稿件来源(5种来源),然后逐条比对格式要求并输出含具体位置的检查报告(含AI写作痕迹检测)。
论文格式合规检查工作流。先询问用户是否有格式要求文件(5种来源),再确定论文稿件来源(5种来源),然后逐条比对格式要求并输出含具体位置的检查报告(含AI写作痕迹检测)。
王derful
未分类 community v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 18
下载
💾 0
安装
1
版本
#latest

概述

Paper Format Check — 论文格式合规检查

触发条件

用户要求检查论文格式、对比格式要求、做格式合规性审核时触发。

完整工作流

Step 0:确认格式要求来源

向用户提问:「有没有学校/学院下发的格式要求文件,或者相关的格式说明?」

分支 A — 用户有格式要求文件

调用 Step 0a 获取文件(支持5种来源)。

分支 B — 用户没有

使用 IMA 知识库中的《论文写作格式基本要求》作为默认标准。如果知识库中也没有,则展示本 Skill 附带的默认规则清单。


Step 0a:获取格式要求文件

来源操作方式
----------------
本地路径用户给出服务器上的路径 → 直接读取
IMA知识库搜索知识库 → 获取 media_id → 调用 get_media_info → curl下载
URL直链curl 下载到本地临时目录
粘贴内容用户粘贴文本 → 直接解析为规则清单
IM/邮件附件从钉钉/飞书/邮件渠道下载附件

→ 解析为结构化规则清单(每条规则含:ID、分类、要求内容、判断方法、是否可自动化、严重度)


Step 0.5:确认论文文件来源

向用户提问:「你的论文稿件在哪里?」

同样支持上述 5种来源


Step 1:逐条格式比对检查

自动化检查项

#检查项实现方式输出格式
------------------------------
1正文行五字以上(排除模板字段)按换行分割,len<5 且非模板字段位置+原文
2正文标点中文全角正则匹配中文句中英文标点位置+标记
3参考文献作者完整检测"等"、"et al"文献序号+原文
4参考文献要素齐全检查年份(19/20xx)、页码文献序号+缺失项
5参考文献标点规则中文全角/英文半角+空格文献序号+问题
6参考文献时效性统计近5年占比总数+近5年数+比例
7一句话超4个逗号按句号分割,finditer位置+原文+逗号数
8禁用表述匹配"新冠疫情"、"疫情"位置+原文
9口语化表达匹配"大家"、"我觉得"等位置+原文+建议
10标题层级检测一/二/三/四级标题各级数量+违规
11图表编号检测图X/表X图表列表
12段落结尾缺标点检测正文段落结尾是否以句号等结束位置+原文

需Word手动检查项

#检查项提醒文案
---------------------
1表格三线式选中表格 → 表格属性 → 边框和底纹 → 上下1.5磅/中间0.5磅
2行距1.25倍Ctrl+A → 段落 → 行距
3数字字母Times New RomanCtrl+A → 字体 → 西文字体
4表格行高0.3cm表格属性 → 行 → 指定高度
5表格与文本同宽表格属性 → 宽度100%
6段落分布目视检查,无单页一段

Step 2:AI写作痕迹检测

在格式检查后作为附加项输出。

检测模式:

特征检测条件示例
----------------------
AI万能过渡句"在本文中"+"会在"/"用于""在本文中,PEST分析会在宏观环境分析部分使用"
定义式句式"是指"/"指的是""差异化战略是指企业通过……"
万能句式"本文以……为研究对象""本文以……为研究对象,运用……方法"
过度"本研究"开头句首"本研究"+"通过/运用/以""本研究遵循'提出问题—分析问题'的经典范式"
工具定义模板工具名+"是"/"由"+"提出""SWOT矩阵由……提出,是……工具之一"
模板列举"一是…二是…三是…"或"首先…其次…再次"
空洞总结"具有重要意义""提供了理论支撑"

Step 3:输出检查报告

报告结构:

【Step 0】格式要求来源
  - 使用XXX文件 / 默认《论文写作格式基本要求》

【Step 0.5】论文文件来源
  - 文件名称、大小、来源

【Step 1】逐条格式比对检查
  - RULE X: ✅/🔴/🟡
    原文: "……"
    位置: 表X-行X
    问题: ……
    要求: ……

【附加】AI写作痕迹检测
  - 共X处
  - 🟧 优先修改:每条附位置和原文

【修改建议汇总】
  - 🔴 必须修改:……
  - 🟡 建议修改:……
  - 📌 需Word手动检查:……

检查脚本

核心脚本位于 scripts/check_format.py。运行方式:

python3 scripts/check_format.py --paper "/path/to/paper.docx" [--rules "/path/to/rules.json"]

如果不传 --rules 参数,使用内置的默认格式要求规则。

脚本注意事项

  1. 参考文献缺年份的处理:年份可能是19xx或20xx,正则要同时匹配 19\d2|20\d2
  2. 逗号检查的句子分割:使用 re.finditer + 句号/问号/感叹号/分号分割,不要用 re.split + 零宽断言
  3. 模板字段排除:开题报告封面字段(学号/性别/男/女/汉/A/H等)不计入正文行长度
  4. 标点检查的参考文献豁免:英文参考文献中的半角标点是合规的,只检查中文正文
  5. 错误处理:使用 try/except 包裹可能出现错误的检查项,确保单条规则失败不影响整体检查

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-06-05 11:06 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

soul-paper-wrangler

user_e8a6e65e
`soul`, `学术写作`, `论文`, `MBA`, `论文助手`, `写作`
★ 0 📥 24

ima-paper-analysis

user_e8a6e65e
IMA 文献分析工具(需要 IMA 凭证)
★ 0 📥 24

local-paper-analysis

user_e8a6e65e
|地文献分析工具(纯本地,零API依赖)
★ 0 📥 23