本技能用于把论文分析从“聊天式建议”升级为“面向复现的执行工作流”。回答必须使用中文。除非工具权限、网络、审批或用户环境阻止,否则不要只告诉用户去执行命令;应优先使用可用工具完成可执行动作。
每次触发后,聊天回复第一行必须输出:
[paper-repro-triage active]
详细结果必须写入 Markdown 文件,聊天只返回极简摘要。
paper-repro-workspace//repro-report.md 。git pull,不要覆盖,不要改用时间戳目录;应读取现有目录做只读检查,并在报告与聊天摘要中写明 已存在,跳过 clone。main.py、config.py、run.py;代码放入 data/、models/、engine/、utils/;requirements.txt、paper-spec.yaml、evidence-map.md、repro-notes.md 统一放入 repro-docs/。该结构是最低基本盘,可按论文需要扩展,但不要默认生成 configs/ 多 YAML 目录、独立 losses/ 目录、scripts/ 训练脚本或 .sh 文件。ASSUMPTION 或 TODO。接受以下输入:论文 PDF、arXiv 链接、论文主页链接、项目页链接、论文标题/摘要/正文片段、GitHub/GitLab 链接,以及“判断是否值得复现”“找代码”“自动 clone”“读仓库”“整理实验配置”“查数据集论文源码”“生成复现工程”“写 md 报告”等请求。
根据当前 OpenClaw 环境中可用的工具执行:
git clone、python scripts/bootstrap_repo.py、python scripts/find_local_code.py、python scripts/inspect_repo_data_processing.py、python scripts/build_paper_spec.py、python scripts/scaffold_repro_project.py、python scripts/inspect_repro_project.py、dir、find、写入 .md 文件。python ...;如果 python 不可用,尝试 py ...。.sh 作为默认路径;本技能不生成 .sh 训练脚本。paper-repro-workspace/。paper-repro-workspace// 。paper-repro-workspace//repro-report.md 。paper-repro-workspace//main-code// 。paper-repro-workspace//dataset-code/// 。paper-repro-workspace//local-code/ 。repro-implementation。必须根据论文框架、方法、模型或任务名生成:paper-repro-workspace//-reproduction/ 。如果只能做 baseline,目录名必须包含 baseline。-reproduction/ 工程。-reproduction/ 。从论文 PDF、arXiv 页面或用户提供文本中提取:标题、作者、年份、会议或期刊、摘要、核心贡献、方法、实验、附录、脚注、代码可用性声明、数据集、指标、baseline、训练细节、图表标题和图注、明确的 GitHub/GitLab/项目页/Hugging Face/数据集链接。
如果无法读取 PDF 或附件,先说明缺失的工具或输入,不要编造论文内容。
必须给出一个主类型,必要时给出次类型。可选类型:综述论文、方法论文、提示词工程论文、基准评测论文、资源论文、理论论文、系统论文。
使用 references/reproducibility-rubric.md。只能输出以下四个标签之一:可以直接复现、部分可复现、不具备实际可复现性、不是复现目标。
必须区分“能不能复现”和“需不需要复现”。不要把“有论文描述”误判成“可以直接复现”。
必须主动搜索论文证据中的代码线索:PDF URL、脚注、附录、作者说明、arXiv abstract 页面、project page、supplementary material、OpenReview 页面、code is available、source code、implementation、official repository、github、project page 等。
如果发现多个仓库,优先判断作者官方仓库。无法确认时,标记为“官方性未验证”。
在进入无代码复现前,必须检查本地是否已有主论文相关源码。优先使用:
python scripts/find_local_code.py --paper-slug <paper-slug> --name <paper-title-or-method> --workspace .
检查范围包括:paper-repro-workspace/、paper-repro-workspace/、当前 agent workspace、环境变量 PAPER_REPRO_LOCAL_CODE_ROOTS。数据集代码目录可以作为辅助证据,但不能直接判定为主论文源码。
如果本地找到高可信主论文源码,不进入无代码复现路径,而是进入“本地代码路径”:读取 README、依赖、训练入口、评测入口、配置、模型、数据处理代码,并写入报告。
当主论文使用或发布数据集、benchmark 或标注资源时,必须执行此步骤。详细流程见 references/dataset-source-tracing.md。
对每个关键数据集,必须:
scripts/inspect_repo_data_processing.py 或等价只读检查定位数据处理代码。如果发现主论文官方/高度可信代码,必须:
python scripts/bootstrap_repo.py main-code ;如 python 不可用,尝试 py scripts/bootstrap_repo.py ...。scripts/inspect_repo_data_processing.py 定位数据处理代码。只要满足以下条件,就必须生成复现工程,而不是只给建议:
如果找到数据集相关源码或 baseline 源码,要将其作为数据处理和 baseline 证据输入复现工程,但不能终止主论文复现工程生成。
详细规则见 references/no-code-reproduction.md。
生成前必须先写 paper-spec.yaml。可以使用:
python scripts/build_paper_spec.py <evidence-md> --out paper-repro-workspace/<paper-slug>/paper-spec.yaml
然后生成工程:
python scripts/scaffold_repro_project.py paper-repro-workspace/<paper-slug>/paper-spec.yaml --out paper-repro-workspace/<paper-slug>/<framework-or-method-slug>-reproduction
生成后运行静态检查:
python scripts/inspect_repro_project.py paper-repro-workspace/<paper-slug>/<framework-or-method-slug>-reproduction
不自动安装依赖,不下载大数据,不运行训练。轻量 py_compile 和文件完整性检查可以自动执行。
最终必须把详细内容写入:paper-repro-workspace/。
报告模板见 references/output-template.md。必须记录:论文信息、分类、可复现性、代码搜索、主论文源码、本地源码、数据集源码、数据处理代码位置、复现工程生成结果、执行过的命令、不能复现原因、未完成项/人工确认项。
聊天中不要输出长报告。聊天回复只输出:
[paper-repro-triage active]
- 报告文件:`paper-repro-workspace/<paper-slug>/repro-report.md`
- 主论文源码:已 clone / 已存在,跳过 clone / 本地已存在 / 未找到 / 等待审批 / clone 失败
- 数据集源码:已 clone N 个 / 已存在,跳过 clone N 个 / 本地已存在 N 个 / 未找到 / 部分找到 / 未检索
- 数据处理代码:已定位 N 处 / 未定位 / 不适用
- 复现工程:已生成 / 仅生成 skeleton / 未生成,路径:`paper-repro-workspace/<paper-slug>/<implementation-slug>/`
- 是否需要复现:需要 / 不需要 / 建议只做部分复现
- 是否能复现:可以直接复现 / 部分可复现 / 不具备实际可复现性 / 不是复现目标
- 核心原因:一句话说明;如果能复现则写“无核心阻碍”
- 执行边界:未运行训练 / 未安装依赖 / 未下载数据;如已存在主论文源码,写“已停在代码导读阶段”
ASSUMPTION。TODO 或 NotImplementedError,报告必须列出。references/reproducibility-rubric.mdreferences/output-template.mdreferences/dataset-source-tracing.mdreferences/no-code-reproduction.mdscripts/bootstrap_repo.pyscripts/find_local_code.pyscripts/inspect_repo_data_processing.pyscripts/build_paper_spec.pyscripts/scaffold_repro_project.pyscripts/inspect_repro_project.py共 1 个版本