← 返回
未分类

Academic Paper Analysis

对学术论文(流行病学、生物统计学方向)进行深度结构化解析。当用户说"分析这篇论文"、"对这篇文献进行分析"、"论文分析"或类似话语时,自动激活此技能。
对流行病学、生物统计学领域的学术论文进行深度结构化解析。当用户提及“分析这篇论文”“对这篇文献进行分析”“论文分析”等关键词时,自动激活此技能。
chircken891 chircken891 来源
未分类 clawhub v1.0.0 1 版本 99719.9 Key: 无需
★ 0
Stars
📥 356
下载
💾 2
安装
1
版本
#latest

概述

Academic Paper Analysis

对学术论文(尤其是流行病学、生物统计学、公共卫生方向)进行深度结构化解析。

触发条件

当用户说以下话语时自动激活:

  • "分析这篇论文"
  • "对这篇文献进行分析"
  • "论文分析"
  • "分析一下这篇文章"
  • "对这篇xxx进行分析"(xxx为任意文献相关描述)
  • 发送 PDF 附件并要求分析

核心原则

解释优先于罗列。

遇到每一个专业术语、方法名称、缩写时,必须当场解释,不能跳过,不能简单罗列。要说明"这个方法是什么"、"为什么要用"、"它的优缺点是什么"。

解析框架

一、研究设计

对每一个术语逐一解释:

  • 研究类型(如:社区为基础的前瞻性纵向队列研究)→ 什么是队列研究?为什么社区为基础的外推性更强?
  • 纳入/排除标准 → 这两个标准分别解决了什么问题?存在哪些选择偏倚?
  • 随访方式(主动随访 vs 被动随访)→ 两者对失访率的影响?
  • 中位随访时间(median follow-up)和四分位距(IQR)→ 为什么用中位数而非均数?
  • 结局指标的定义 → 如何定义?来自哪些数据来源?是否经过验证?

二、暴露因素/指标构建(如涉及复合指标)

  • 概念解释:这个构念(construct)是什么?能不能直接测量?
  • 代理指标(Proxy Indicator):为什么用代理?各代理指标的测量方式是什么?
  • 统计方法:如果用了因子分析/潜在类别分析(LCA)/主成分分析(PCA)等降维方法 → 这些方法的核心思想是什么?为什么选择这个方法而非简单相加?
  • 分类阈值:cut-off 值是如何确定的?敏感性如何?

三、统计方法(每个方法都要解释)

对每个统计方法提供:

  1. 方法名称 + 全称
  2. 这个方法是用来解决什么问题的?
  3. 基本原理(用通俗语言)
  4. 核心结果的解读方式(如 HR、OR、RR、PD 的区别)
  5. 该方法的局限性

常见方法及解释模板:

方法解释重点
---------------
Cox比例风险回归HR 的含义、比例风险假设是什么
Kaplan-Meier生存分析生存曲线的读取、中位生存时间
Logistic回归OR值的含义、优缺点
多状态Markov模型竞争风险问题、状态转移框架
Laplace回归/分位数回归为什么要报告绝对效应而不仅是相对效应
潜在类别分析(LCA)探测性分析方法、与聚类的区别、后验概率
多重插补(MICE)为什么要插补、插补的假设前提
倾向性评分(PSM/PS分析)解决混杂的方法、与随机对照试验的区别
交互效应(相乘 vs 相加)RERI/AP/SI 的公共卫生意义

四、结果呈现

表格的每一列、每一个数字都要有解读:

  • "这个 HR=0.82 意味着什么?"
  • "基本调整模型和多因素调整模型的差异说明了什么?"
  • "置信区间包含1说明什么问题?"

识别并提取表格的布局规范(自动执行):

  • 看到 Table 1 → 识别行结构(哪些变量、嵌套层次)、列结构(分组数量和排列)、格式规范(连续/分类变量的具体格式)
  • 看到 Table 2/3 → 识别行=结局、列=模型调整层级(基本调整 vs 多因素调整)、格式(HR/CI/Ref 标注方式)
  • 看到亚组分析表 → 识别行=亚组变量、列=暴露分组、末尾有 Interaction P 值列

五、局限性分析

不只列举局限,要说明:

  • 每个局限如何影响结论的可靠性
  • 作者是否在文中采取了相应措施(如敏感性分析)
  • 这些局限是所有同类研究的共性问题还是本研究的特有问题

输出格式

按以下顺序分节输出,每节都要有足够深度和解释:

## 一、研究设计
[详细解析]

## 二、暴露/指标构建方法
[详细解析]

## 三、统计方法
[详细解析]

## 四、研究结果
[详细解析]

## 五、英文原文摘要 + 中文翻译(全文)
[如果论文是英文的,必须提供:Abstract 全文原文 + 完整中文翻译,不删减,不选译]

## 六、讨论部分原文 + 中文翻译(全文)
[如果论文是英文的,必须提供:Discussion 全文原文 + 完整中文翻译,不删减,不选译]

## 七、方法学亮点与局限性
[详细解析]

四-副:图表布局提取(自动存入数据库)

分析论文时,主动识别论文中所有表格,对每个表格提取以下制表逻辑并存入数据库:

对每个识别到的 Table:

  1. 表格命名:Table 1、Table 2...
  2. 行结构:变量在行里怎么排列(嵌套逻辑、分组方式)
  3. 列结构:列与列之间的关系(不同模型 vs 不同暴露组)
  4. 变量顺序:变量在行内的排列规则(如人口学→生活方式→代谢指标)
  5. 格式规范
    • 连续变量:均值±SD 还是 中位数(IQR)?
    • 分类变量:n(%) 格式?百分比保留几位小数?
    • HR/CI:保留几位小数?Ref 怎么标注?
  6. 统计方法:用了什么检验?什么模型?
  7. 脚注/注释习惯:作者喜欢在脚注里放什么信息?

存入路径:D:\autoclaw\结果\医学研究方法库\methods.dbtable_layouts

输出格式

按以下顺序分节输出,每节都要有足够深度和解释:

## 一、研究设计
[详细解析]

## 二、暴露/指标构建方法
[详细解析]

## 三、统计方法
[详细解析]

## 四、研究结果
[详细解析]

## 五、英文原文摘要 + 中文翻译(全文)
[如果论文是英文的,必须提供:Abstract 全文原文 + 完整中文翻译,不删减,不选译]

## 六、讨论部分原文 + 中文翻译(全文)
[如果论文是英文的,必须提供:Discussion 全文原文 + 完整中文翻译,不删减,不选译]

## 七、方法学亮点与局限性
[详细解析]

## 八、图表布局规范(自动存入数据库)
[识别论文中所有 Table,提取每个表格的制表逻辑,逐表列出]

注意事项

  • 收到 PDF 后优先用 PyPDF2(conda 环境)完整读取,再进行分析
  • 不要省略任何一个专业术语的解释
  • 分析要基于原文数据,不要推测
  • 如果论文是英文的,Abstract 和 Discussion 必须提供原文+中文翻译
  • 如果 PDF 是英文的,同时提供英文原术语和中文解释
  • 图表布局提取是自动执行的,不需要用户要求,分析论文时必然执行并写入数据库

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 04:25 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

Mem0 Memory

chircken891
mem0 本地记忆层完整实现(增强版),语义记忆存储/检索/管理,WAL 协议,会话状态,多级记忆(用户/会话/代理),参考 ZejunCao/bilibili_code 中 Mem0 框架解读的优化。
★ 0 📥 1,779

Method Repository

chircken891
将论文中提取的流行病学研究设计与统计方法存入本地知识库,实现去重,触发词:“存入数据库”“保存到知识库”“记一下这个方法”。
★ 0 📥 312

Mem0 Status Check

chircken891
检查 mem0 本地记忆系统的功能完整性和运行状态。触发词:mem0状态、mem0功能、检查mem0、mem0正常吗、mem0完整性
★ 0 📥 291