name: academic-paper-interpreter
description: 这是一个专门用于解析 Arxiv 算法论文的 Skill。它通过逐段阅读和多轮反思机制,将论文的复杂模型架构和实验数据转化为专业、无遗漏的长文本内容。
1.触发条件 (Boundaries)
- Use this skill when: 用户提供论文标题,且目标是生成极度详细、专业的长文本。
- Do NOT use this skill when: 用户仅需要简短的摘要(TLDR);或论文非算法/计算机科学类。
2. 接口定义 (Input & Output)
- Input: paper_name_or_id (string)
- Output: professional_long_article (string, 包含深度模型拆解与核心算法逻辑的文字概括,严禁包含公式)
3. 执行工作流 (Workflow)
Phase 1: 资源获取与原子化阅读 (Plan)
- 接收请求:获取用户的论文标题或 ID。
- 论文获取:优先且必须尝试从 Arxiv 下载该论文的 PDF。
- [网络重试机制]:如果网络不佳,必须至少重试 3 次。
- [人工介入机制]:如果重试后仍失败,或者 Arxiv 上没有该论文,必须立即停止流程,回复:“未能在 Arxiv 获取到该论文,请提供论文 PDF 文件。” 取得文件后再继续。
- 逐段扫描:对论文进行“原子化阅读”,将 Abstract, Intro, Methodology (Architecture), Experiments 等章节的所有段落进行索引,确保没有任何一个段落被跳过。
Phase 2: 内容生成 (Execute)
按照以下模板撰写,实时标注内容来源(例如:[Ref: Section 3.2])。
- [标题] (结合论文核心卖点,起一个吸引人的标题)
- [TLDR] (简洁概要:三句话说明过去的问题 + 本文的解决方法 + 取得的核心收益;必须简洁!)
- [过去面临的问题] (简洁概要:分点给出行业/领域当前存在的痛点;参考 Abstract 和 Introduction;必须简洁!)
- [本文的解决方法] (简洁概要:分点给出本文提出的核心创新思路;参考 Abstract 和 Introduction;必须简洁!)
- [核心收益] (说明离线/线上 AB 实验结果或指标提升情况)
- [模型架构] (认真阅读论文模型架构的每一段落并进行极度详细的拆解。严禁出现数学公式,必须严格遵循以下分点要求):
- 模块首句概括:在拆解每一个小模块(如输入端、各核心网络层、输出端)时,开头必须用一句简洁的话概括该模块的核心作用。
- 输入端处理描述:详细说明原始数据如何被解析、清洗并转化为模型可识别的初始特征表达。
- 核心逻辑拆解:使用简洁的语言概括核心节点的计算逻辑。描述数据流向,说明特征是如何被映射、加权、转换或聚合的(仅允许使用 S 代表序列等必要符号,严禁公式)。
- 计算过程概括:将论文中的公式推导转化为对变量间逻辑关系的文字描述。
- 输出端预测:详细说明网络末端如何将处理后的特征转化为最终的预测结果或分类概率。
- [实验部分] (说明模型设计的有效性,包含消融实验、对比实验或 Scaling 分析。)
Phase 3: 强制反思与内容补全 (Validate)
在输出最终版本前,必须执行以下内部检查清单:
- [ ] 模板符合度:是否严格包含[标题]至[实验部分]的所有模块。
- [ ] 简洁性检查:[过去面临的问题]和[本文的解决方法]是否做到了分点且语言精炼。
- [ ] 架构深度检查:[模型架构]是否足够详细?每个小模块开头是否都有“一句话作用概括”?
- [ ] 零公式检查:全文是否彻底清除了数学公式? 所有公式是否已成功转化为文字逻辑描述?
- [ ] 覆盖率检查:对比 Phase 1 索引,是否遗漏了 Methodology 或 Experiments 中的任何关键段落。
- 修正动作:若有遗漏,必须在相应位置补全。
- [ ] 逻辑连贯性:从输入到输出的描述是否形成闭环,确保非专家也能读懂数据流向。
Phase 5: 最终输出
将反思修正后的最终内容,以 .md 文件的形式发送给用户。
4. 失败处理策略 (On Failure)
- 解析歧义:若算法计算逻辑描述过于模糊,必须标记
[需进一步核实],严禁臆造。 - 重试机制:网络超时或 PDF 损坏时,遵循“异常捕获 -> 报错提示 -> 下一步建议”处理。
"""