本技能采用多 Agent 协作模式。作为主控 Agent,你的核心职责是:
❌ 请不要试图自己在单次对话中完成所有长文本阅读和细节比对。
收到 PDF 后,第一步必须做:
which pdftotext pdfinfo ...)❌ 禁止直接开始处理!
| 原则 | 说明 |
|---|---|
| ------ | ------ |
| 不要自己读长文本 | 必须派生 Reader 子 Agent |
| 不要自己上传图片 | 必须派生 Vision 子 Agent |
| 不要自我审核 | 必须派生 Reviewer + 真实数据注入 |
| 必须等用户确认 | 阶段四必须挂起 |
| 必须用占位符 | Reader 必须插入 【FIGURE_X】 |
确保以下工具可用:pdftotext, pdfinfo, pdfimages, pdftoppm, tesseract, jq。
如果缺失,通过以下命令安装:
# PDF 处理工具
sudo apt-get install -y poppler-utils
# OCR 工具
sudo apt-get install -y tesseract-ocr tesseract-ocr-eng tesseract-ocr-chi-sim
# JSON 处理工具(脚本中大量使用)
sudo apt-get install -y jq
快速检查:
which pdftotext pdfinfo pdfimages pdftoppm tesseract jq
# 所有命令都应该返回路径
在阶段零开始时,主控 Agent 必须创建以下目录结构:
mkdir -p "$PAPER_DIR/logs/scripts"
mkdir -p "$PAPER_DIR/progress"
mkdir -p "$PAPER_DIR/errors"
目录说明:
| 目录 | 用途 | 内容 |
|---|---|---|
| ------ | ------ | ------ |
$PAPER_DIR/logs/ | 统一日志目录 | 所有 Agent 和脚本的日志 |
$PAPER_DIR/logs/scripts/ | 脚本日志 | extract_metadata.log, locate_figures.log 等 |
$PAPER_DIR/progress/ | 进度报告 | Markdown 格式的子 Agent 完成报告 |
$PAPER_DIR/errors/ | 错误报告 | 错误日志和堆栈跟踪 |
优点:
日志目录创建:
mkdir -p "$PAPER_DIR/logs/scripts"
mkdir -p "$PAPER_DIR/progress"
mkdir -p "$PAPER_DIR/errors"
log_master "✅ 日志目录已创建"
目标:检查论文是否已处理,避免重复工作。
```bash
scripts/extract_metadata.sh
```
```bash
scripts/check_duplicate.sh "$PAPER_DIR/metadata.json" "$PAPERS_DIR"
result=$? # 保存退出码
# 检查脚本输出中的 RESULT 变量
if echo "$output" | grep -q "RESULT=duplicate"; then
echo "❌ 完全重复:该论文已处理过"
echo "📋 飞书文档:$(cat $PAPER_DIR/feishu_doc_token.txt)"
exit 1 # 停止任务
elif echo "$output" | grep -q "RESULT=possible_duplicate"; then
echo "⚠️ 可能重复:已存在飞书文档,但 PDF 文件未找到"
echo "📋 请用户确认是否继续"
# 等待用户确认
fi
# 检查退出码
if [[ $result -eq 1 ]]; then
echo "❌ 去重检查失败,停止任务"
exit 1
fi
```
$PAPER_DIR,复制 PDF,进入阶段一⚠️ 重要:主控 Agent 必须检查脚本的退出码和 RESULT 变量,如果检测到重复(RESULT=duplicate 或退出码 1),必须立即停止任务,不得继续执行后续阶段!
日志要求:
目标:提取 PDF 文本并生成结构化总结初稿。
```bash
scripts/extract_pdf_text.sh "$PAPER_DIR/paper.pdf" "$PAPER_DIR/paper.txt" "$PAPER_DIR"
```
sessions_spawn):```bash
sessions_spawn task="你是一个专业的学术阅读助手 (Reader)。
任务:
数据精度要求:
图片占位符要求(重要!):
【FIGURE_X】【】,因为飞书会过滤 HTML 注释 ```markdown
## 研究设计
本研究采用随机对照试验设计...
【FIGURE_1】
## 核心结果
LLM 单独表现优异...
【FIGURE_2】
```
进度日志(必须写入):
```
[YYYY-MM-DD HH:MM:SS] Reader 子 Agent 启动
[YYYY-MM-DD HH:MM:SS] 开始读取 paper.txt (共 XXX 行)
```
```
[YYYY-MM-DD HH:MM:SS] ✅ 完成:研究背景与动机
[YYYY-MM-DD HH:MM:SS] ✅ 完成:研究设计
...
```
```
[YYYY-MM-DD HH:MM:SS] ✅ Reader 任务完成
[YYYY-MM-DD HH:MM:SS] 输出文件:$PAPER_DIR/summary.md (XXX KB)
[YYYY-MM-DD HH:MM:SS] 总耗时:X 分钟
```
完成后汇报(向我报告):
```markdown
## Reader 子 Agent 完成报告
开始时间: YYYY-MM-DD HH:MM
完成时间: YYYY-MM-DD HH:MM
耗时: X 分钟
### 执行结果
### 输出文件
$PAPER_DIR/summary.md (XXX KB, XXX 行)$PAPER_DIR/progress/reader.log (进度日志)### 论文关键信息
### 问题与备注
<如有问题,在此说明;如无问题,填写"无">
```
确认后向我(主控 Agent)报告。"
```
$PAPER_DIR/summary.md 已生成。目标:创建飞书文档并插入图表。
```bash
feishu_doc action=create title="总结:<论文标题>"
```
获取 doc_token 并保存到 $PAPER_DIR/feishu_doc_token.txt。
```bash
# ⚠️ 注意:必须使用 Reader 生成的完整 summary.md,不要手动修改或精简
feishu_doc action=write doc_token="
```
```bash
scripts/locate_figures.sh "$PAPER_DIR/paper.pdf" "$PAPER_DIR/paper.txt" "$PAPER_DIR/images"
```
输出说明:脚本使用 pdfimages 提取 PDF 中所有嵌入图片,生成 fig_01.png, fig_02.png 等文件。
注意:提取的图片可能包含图标、线条等小文件(<10KB),Vision 子 Agent 需要筛选真正的 Figure(通常 >100KB)。
```bash
# 从配置中自动查找支持图片输入的模型
VISION_MODEL=$(jq -r '
.models.providers | to_entries[] |
.value.models[] |
select(.input and (.input | index("image"))) |
.id |
first
' "~/.openclaw/openclaw.json" 2>/dev/null)
# 如果找不到支持图片的模型,使用主模型
if [[ -z "$VISION_MODEL" || "$VISION_MODEL" == "null" || "$VISION_MODEL" == "" ]]; then
VISION_MODEL=$(jq -r '.agents.defaults.model.primary' "~/.openclaw/openclaw.json")
echo "⚠️ 未找到支持图片的模型,使用主模型:$VISION_MODEL"
else
echo "👁️ Vision 模型(自动识别):$VISION_MODEL"
fi
```
sessions_spawn):```bash
sessions_spawn task="你是一个视觉处理专家 (Vision)。
任务:
🚨 飞书操作关键规则(必须遵守,否则失败):
1. 防限流:
upload_image 后必须 sleep 3 秒2. 智能匹配占位符(修正版流程) ⭐:
list_blocks 获取所有 blocks,从 root block 的 children 数组中查找占位符的位置 关键:占位符的 index 是它在 root block 的 children 数组中的位置(0-based)
```
```
记录:每个占位符的 block_id 和 index(在 children 数组中的位置)
2a. OCR 提取文字:
```bash
tesseract image.png stdout --psm 6
```
提取 Figure 编号和标题。
2b. 视觉模型理解(重要!OCR 失败时必须执行):
```
使用 read 工具读取图片文件(路径:$PAPER_DIR/images/xxx.png)
读取时附带问题(让模型分析图片):
"请分析这张图片:
请用简洁的格式回复,例如:
类型:柱状图
关键词:条件识别率,GPT-4o, Llama 3, 94.7%
Figure 编号:Figure 2"
```
说明:
model 参数已设置为支持图片的模型(如 qwen3.5-plus)read 工具读取图片后,模型会自动"看到"并分析2c. 匹配占位符:
block_id 和 index```
a. delete_block(block_id: 占位符的 block_id)
b. 记录原 index = N
c. sleep 1 秒(让飞书处理删除)
d. upload_image(..., parent_block_id: 文档根 ID, index: N)
e. 【关键验证】检查 file_token:
f. sleep 3 秒(防限流,必须执行!)
g. 记录:图片上传成功,block_id = xxx
```
【FIGURE_1】)```
list_blocks 检查 Image block (block_type 27) 数量
应该等于上传的图片数量
```
3. 精确定位参数:
parent_block_id: 文档根 ID(和 doc_token 相同)index: 占位符 block 的 index(在占位符位置插入)parent_block_id 则追加到末尾4. 上传后验证:
file_token 不为空字符串read 查看文档,确认图片数量正确5. 失败处理(重置法):
delete_block 返回 404(block 不存在)upload_image 返回空 file_tokenfeishu_doc action=write doc_token="$DOC_TOKEN" content="$(cat $PAPER_DIR/summary.md)"(使用完整文件,不要精简)list_blocks → 找占位符 → 上传图片)操作流程:
write 写入 summary.md(含占位符 【FIGURE_X】 和预期描述)list_blocks 获取所有 blocks,读取占位符预期描述```
a. OCR 提取:tesseract image.png stdout --psm 6
b. 视觉模型理解(OCR 失败时必需):
调用 read 工具读取图片,附带问题:
"请分析这张图片的类型、关键词、Figure 编号"
示例模型回复:
"类型:柱状图
关键词:条件识别率,GPT-4o, 94.7%
Figure 编号:Figure 2"
c. 匹配占位符:
【FIGURE_2】"柱状图" + "条件识别率" → 匹配预期描述为"柱状图,展示条件识别率"的占位符
d. 获取占位符的 index(从 list_blocks 结果中)
```
index 位置 upload_imagedelete_block 删除占位符图片验证:
进度日志(必须写入):
```
[YYYY-MM-DD HH:MM:SS] Vision 子 Agent 启动
[YYYY-MM-DD HH:MM:SS] 飞书文档 token:
[YYYY-MM-DD HH:MM:SS] 待上传图片:X 张
```
```
[YYYY-MM-DD HH:MM:SS] ✅ 写入 summary.md(含占位符和预期描述)
[YYYY-MM-DD HH:MM:SS] ✅ list_blocks 获取 blocks 列表
[YYYY-MM-DD HH:MM:SS] ✅ 找到占位符:【FIGURE_1】(index: X, 预期:流程图)
```
```
[YYYY-MM-DD HH:MM:SS] 📸 处理图片:figure_1.png
[YYYY-MM-DD HH:MM:SS] 🔍 OCR 结果:Figure 1, 流程图
[YYYY-MM-DD HH:MM:SS] 👁️ 视觉模型分析:类型=流程图,关键词=研究设计,分组
[YYYY-MM-DD HH:MM:SS] 🎯 匹配占位符:【FIGURE_1】(index: 4, 预期:流程图)
[YYYY-MM-DD HH:MM:SS] ✅ Fig. 1 上传成功 (file_token: xxx, 527 KB, index: 4)
[YYYY-MM-DD HH:MM:SS] ✅ 删除占位符【FIGURE_1】
[YYYY-MM-DD HH:MM:SS] ⏳ 等待 3 秒(防限流)...
[YYYY-MM-DD HH:MM:SS] 🔍 OCR 结果:失败(无文字)
[YYYY-MM-DD HH:MM:SS] 👁️ 视觉模型分析:类型=柱状图,关键词=条件识别率,GPT-4o, 94.7%
[YYYY-MM-DD HH:MM:SS] 🎯 匹配占位符:【FIGURE_2】(index: 13, 预期:柱状图,展示条件识别率)
[YYYY-MM-DD HH:MM:SS] ✅ Fig. 2 上传成功 (file_token: xxx, 442 KB, index: 13)
...
```
```
[YYYY-MM-DD HH:MM:SS] ✅ Vision 任务完成
[YYYY-MM-DD HH:MM:SS] 成功上传:X/ Y 张图片
[YYYY-MM-DD HH:MM:SS] 智能匹配成功:X 张(命中率 XX%)
[YYYY-MM-DD HH:MM:SS] 总耗时:X 分钟
```
完成后汇报(向我报告):
```markdown
## Vision 子 Agent 完成报告
开始时间: YYYY-MM-DD HH:MM
完成时间: YYYY-MM-DD HH:MM
耗时: X 分钟
### 执行结果
### 输出文件
$PAPER_DIR/progress/vision.log (进度日志)### 图片上传详情
| Figure | 大小 | 占位符 index | file_token | 匹配方式 | 状态 |
|--------|------|-------------|------------|----------|------|
| Fig. 1 | 527 KB | 4 | MsRLbdZbVo9... | OCR | ✅ |
| Fig. 2 | 442 KB | 13 | NjuFbqaz8oT... | 视觉模型 | ✅ |
### 匹配统计
### 问题与备注
<如有问题,在此说明;如无问题,填写"无">
```
确认后向我(主控 Agent)报告。" model="$VISION_MODEL"
```
日志要求:
目标:通过注入真实数据防止审核幻觉。
核心防幻觉机制:必须将原始文本的切片直接喂给审核模型,不能让它空对空审核。
```bash
FALLBACK_MODEL=$(jq -r '.agents.defaults.model.fallbacks[0]' "~/.openclaw/openclaw.json")
```
如果没有配置,则使用当前主模型。告知用户正在启动交叉审核。
sessions_spawn):```bash
sessions_spawn task="你是一个严苛的学术审核员 (Reviewer)。
【原始论文关键数据提取】:
$(cat $PAPER_DIR/paper.txt | grep -E '%|p<|p=|CI|n=' | head -n 30)
【生成的总结内容】:
$(cat $PAPER_DIR/summary.md)
请重点核查:
进度日志(必须写入):
```
[YYYY-MM-DD HH:MM:SS] Reviewer 子 Agent 启动
[YYYY-MM-DD HH:MM:SS] 审核模型:<模型名称>
[YYYY-MM-DD HH:MM:SS] 开始数据一致性核对
```
```
[YYYY-MM-DD HH:MM:SS] ✅ Reviewer 任务完成
[YYYY-MM-DD HH:MM:SS] 审核结果:通过 / 需要修改
[YYYY-MM-DD HH:MM:SS] 总耗时:X 分钟
```
输出要求:
请直接输出一份详尽的《审核报告及修改建议清单》,格式如下:
```markdown
## 审核报告
### 一致的内容
### 需要修改的内容
### 格式问题
### 总体评价
<通过/需要修改>
```
完成后汇报(向我报告):
```markdown
## Reviewer 子 Agent 完成报告
开始时间: YYYY-MM-DD HH:MM
完成时间: YYYY-MM-DD HH:MM
耗时: X 分钟
审核模型: <模型名称>
### 执行结果
### 审核统计
### 输出文件
$PAPER_DIR/progress/reviewer.log (进度日志)$PAPER_DIR/audit_report.md (审核报告全文)### 关键问题
<如有严重问题(如数据错误、结论夸大),在此说明>
### 修改建议清单
...
```
确认后向我(主控 Agent)报告。" model="$FALLBACK_MODEL"
```
步骤 4a:读取审核报告
```bash
# 读取审核报告
AUDIT_REPORT="$PAPER_DIR/progress/audit_report.md"
# 提取修改建议清单
MODIFY_LIST=$(grep -A 20 "修改建议清单" "$AUDIT_REPORT")
```
步骤 4b:逐项应用修改
```bash
# 对每个修改建议:
# 1. 使用 list_blocks 找到需要修改的 block_id
# 2. 使用 update_block 修改文本块
# 3. 使用 insert/append 添加缺失内容
# 4. 记录修改日志
```
修改原则:
update_block 修改对应文本块insert 在相应位置添加update_block 调整格式success: true步骤 4c:验证修改
```bash
# 使用 read 查看飞书文档
# 确认所有修改已应用
# 记录验证结果到 progress/audit_apply.log
```
目标:让用户确认审核报告并决定是否修改。
```
📄 飞书初稿链接:
## 审核报告摘要
<审核报告内容>
## 修改建议清单
<具体修改建议>
---
⏳ 请确认是否采纳以上修改建议:
| 回复 | 操作 |
|------|------|
| 【确认】 | 自动应用修改,输出最终版 |
| 【修改 xxx】 | 进行微调(告诉我具体修改内容) |
| 【跳过】 | 保留现状,输出最终版 |
```
目标:应用修改并输出最终版。
如果用户回复【确认】:
```bash
# 1. 读取审核报告中的修改建议清单
AUDIT_REPORT="$PAPER_DIR/progress/audit_report.md"
# 2. 对每个修改建议执行:
# a. 使用 list_blocks 找到目标 block_id
# b. 使用 update_block 修改内容
# c. 验证修改成功 (success: true)
# d. 记录修改日志
# 3. 使用 read 验证所有修改已应用
# 4. 记录验证结果到 progress/audit_apply.log
```
修改方法:
| 修改类型 | 使用工具 | 说明 |
|----------|---------|------|
| 修改文本 | update_block | 需要提供正确的 block_id |
| 添加内容 | insert / append | insert 在指定位置,append 追加到末尾 |
| 修改表格 | write_table_cells | 修改表格单元格内容 |
| 添加表格行 | insert_table_row | 在表格中添加新行 |
验证流程:
```bash
# 1. 使用 read 查看飞书文档
# 2. 确认所有修改已应用
# 3. 如果有遗漏,重新执行修改
# 4. 记录最终验证结果
```
如果用户回复【修改 xxx】:根据用户具体要求修改。
如果用户回复【跳过】:保持现状,记录"用户选择跳过修改"。
在文档末尾追加署名块(严格按照 summary_template.md 的表格要求):
```markdown
## 📝 文档信息
| 项目 | 信息 |
|------|------|
| 撰写人 | Lux(qwencode/qwen3.5-plus) |
| 审核状态 | ✅ 已审核 / ⏭️ 已跳过 |
| 审核模型 | <审核模型名称> |
| 生成时间 |
| 文档版本 | v1.0(最终版) |
审核修改记录:
```
保存最终状态到 $PAPER_DIR/final_metadata.json。
```bash
# 保存修改记录到 progress/audit_apply.log
# 包含:修改项、修改前、修改后、修改时间、验证结果
```
如果在【阶段零】判定传入的 PDF 为补充材料:
```bash
DOC_TOKEN=$(cat "$PAPER_DIR/feishu_doc_token.txt")
```
```bash
scripts/merge_supplement.sh "$PAPER_DIR" "
```
feishu_doc action=append 将补充摘要追加到主文档的"📎 补充材料"章节中。原则:每个阶段完成后,立即清理已完成的子 Agent,只保留主控 Agent
实现:
sessions_yield)subagents action=kill target="$session_key"示例:
# 阶段一:Reader Agent
reader_session=$(sessions_spawn task="Reader..." label="Reader-Agent")
sessions_yield # 等待完成
summary_md=$(cat "$PAPER_DIR/summary.md") # 获取结果
subagents action=kill target="$reader_session" # ← 清理 Reader
# 阶段二:Vision Agent
vision_session=$(sessions_spawn task="Vision..." label="Vision-Agent")
sessions_yield
doc_token=$(cat "$PAPER_DIR/feishu_doc_token.txt")
subagents action=kill target="$vision_session" # ← 清理 Vision
# 阶段三:Reviewer Agent
reviewer_session=$(sessions_spawn task="Reviewer..." label="Reviewer-Agent")
sessions_yield
audit_report=$(cat "$PAPER_DIR/audit_report.md")
subagents action=kill target="$reviewer_session" # ← 清理 Reviewer
# 最终:只保留主控 Agent
好处:
sessions_spawn 派生子 Agent核心原则:
> 📌 通用工具用法参考 feishu-doc 技能文档
> 📌 本节只记录本业务特有的纠偏规则和易错点
规则:任何涉及 upload_image 的循环操作,必须:
feishu_doc action=upload_image ...
sleep 3 # 必须间隔 3 秒
feishu_doc action=upload_image ...
sleep 3 # 必须间隔 3 秒
违反后果:
file_token 为空字符串严重限流时:
适用场景:
delete_block 返回 404(block 不存在)upload_image 返回空 file_token操作步骤:
# 1. 使用 Reader 生成的完整 summary.md(不要精简)
# 2. 全量覆盖(清除所有旧 blocks)
feishu_doc action=write doc_token="$DOC_TOKEN" content="$(cat $PAPER_DIR/summary.md)"
# 3. 重新 upload_image 上传图片
# 4. read 查看文档确认结果
效果:清除所有旧 blocks,恢复到干净状态。
方案对比:
| 场景 | 方案 | 地位 |
|---|---|---|
| ------ | ------ | ------ |
| 文档结构混乱、block IDs 失效 | 重置法(write 全量覆盖) | 兜底方案 |
| 图片精确定位 | 占位符法(【FIGURE_X】) | 首选方案 |
历史经验:
delete_block 404 错误,使用重置法成功任何飞书文档修改操作前,必须:
list_blocks 获取最新 blocks 列表list_blocks + read 验证参数说明:
parent_block_id: 文档根 ID(和 doc_token 相同)index: 从 list_blocks 的 children 数组获取(0-based)parent_block_id 则自动追加到末尾定位方法:
# 从 list_blocks 返回中找到章节标题的 block_id
# 计算其 index(在 children 数组中的位置)
# 上传图片时 index = 章节 index + 1
插入策略:
必须检查:
upload_image 返回的 file_token 不为空字符串read 查看文档,确认图片数量正确验证命令:
feishu_doc action=read doc_token="$DOC_TOKEN"
# 检查 "Image" 数量是否正确
# 如果 "Image": 7,说明 7 张图片都已成功上传
不要混淆:
| 操作 | 用途 | 常见错误 | 解决方案 |
|---|---|---|---|
| ------ | ------ | ---------- | ---------- |
feishu_doc delete_block | 删除文档块 | 404(block 不存在) | 用重置法(write 全量覆盖) |
feishu_drive delete | 删除云空间文件 | 400(权限问题) | 检查文件权限 |
子 Agent 错误报告机制:
子 Agent 错误报告机制:
如果子 Agent 执行失败,必须写入错误报告:
# 错误报告格式 ($PAPER_DIR/errors/<agent>.log)
## 错误报告
**子 Agent**: Reader/Vision/Reviewer
**错误类型**: 脚本执行失败 / API 限流 / 文件不存在 / 超时 / ...
**错误信息**: <具体错误内容>
**发生时间**: YYYY-MM-DD HH:MM:SS
**重试次数**: X/3
### 建议操作
<主控 Agent 应该采取的行动,如:重试、跳过、人工介入等>
主控 Agent 响应流程:
$PAPER_DIR/errors/.log 常见错误处理:
| 错误类型 | 错误代码 | 处理方案 |
|---|---|---|
| ---------- | ---------- | ---------- |
| 飞书 API 限流 | 429 | 等待 10 秒后重试,增加 sleep 时间到 5 秒 |
| Block 不存在 | 404 | 重新获取 blocks 列表,或使用重置法 |
| PDF 无法提取文本 | - | 检查是否为扫描版,建议使用 OCR |
| 子 Agent 超时 | - | 增加 timeoutSeconds,或拆分任务 |
| 文件不存在 | - | 检查路径,重新运行前置脚本 |
| jq 解析失败 | - | 检查 JSON 格式,手动修复 metadata.json |
| OCR 识别失败 | - | 检查 tesseract 是否安装,语言包是否存在 |
| 图片上传失败 | - | 检查图片文件是否存在,大小是否超过限制 |
重试机制示例:
# 飞书 API 调用重试
max_retries=3
retry_count=0
while [[ $retry_count -lt $max_retries ]]; do
result=$(feishu_doc action=upload_image ...)
if echo "$result" | grep -q '"success": true'; then
echo "✅ 上传成功"
break
elif echo "$result" | grep -q "429"; then
retry_count=$((retry_count + 1))
echo "⚠️ API 限流,等待 10 秒后重试 ($retry_count/$max_retries)"
sleep 10
else
echo "❌ 上传失败:$result"
break
fi
done
if [[ $retry_count -eq $max_retries ]]; then
echo "❌ 达到最大重试次数,任务失败"
# 写入错误日志
echo "错误类型:API 限流" >> "$PAPER_DIR/errors/vision.log"
echo "重试次数:$max_retries" >> "$PAPER_DIR/errors/vision.log"
echo "建议操作:等待 5 分钟后重试,或联系用户" >> "$PAPER_DIR/errors/vision.log"
fi
| 子 Agent | 职责 | 关键技能 | 进度日志 |
|---|---|---|---|
| ---------- | ------ | ---------- | ---------- |
| Reader | 长文本阅读、总结生成 | 分段读取、信息提取、结构化输出 | progress_reader.log |
| Vision | 图片审核、飞书上传 | 图片识别、upload_image、限流规避 | progress_vision.log |
| Reviewer | 数据一致性核对 | 数据比对、格式检查、报告生成 | progress/reviewer.log |
每个子 Agent 执行时都会生成进度日志文件,便于调试和审计:
| 文件 | 说明 | 生成时机 |
|---|---|---|
| ------ | ------ | ---------- |
$PAPER_DIR/progress/reader.log | Reader 子 Agent 进度 | 阅读论文时 |
$PAPER_DIR/progress/vision.log | Vision 子 Agent 进度 | 上传图片时 |
$PAPER_DIR/progress/reviewer.log | Reviewer 子 Agent 进度 | 审核数据时 |
$PAPER_DIR/errors/ | 错误报告 | 发生错误时 |
[YYYY-MM-DD HH:MM:SS] <Agent> 子 Agent 启动
[YYYY-MM-DD HH:MM:SS] 开始 <任务描述>
[YYYY-MM-DD HH:MM:SS] ✅ 完成:<步骤 1>
[YYYY-MM-DD HH:MM:SS] ✅ 完成:<步骤 2>
[YYYY-MM-DD HH:MM:SS] ✅ <Agent> 任务完成
[YYYY-MM-DD HH:MM:SS] 输出文件:<文件路径>
[YYYY-MM-DD HH:MM:SS] 总耗时:X 分钟
## 错误报告
**子 Agent**: <Agent 名称>
**错误类型**: <错误类型>
**错误信息**: <具体错误>
**发生时间**: YYYY-MM-DD HH:MM:SS
**重试次数**: X/3
### 建议操作
<主控 Agent 应该采取的行动>
## Reader 子 Agent 完成报告
**开始时间**: YYYY-MM-DD HH:MM
**完成时间**: YYYY-MM-DD HH:MM
**耗时**: X 分钟
### 执行结果
- ✅ 成功生成 summary.md
### 输出文件
- `$PAPER_DIR/summary.md` (XXX KB, XXX 行)
- `$PAPER_DIR/progress/reader.log` (进度日志)
### 论文关键信息
- **研究类型**: <如 RCT、队列研究等>
- **样本量**: <如 2,069 人>
- **主要结局**: <如 问诊时长减少 28.7%>
### 问题与备注
<如有问题,在此说明;如无问题,填写"无">
### 详细进度
| 步骤 | 状态 | 耗时 |
|------|------|------|
| 读取 paper.txt | ✅ 完成 | X 秒 |
| 提取研究背景 | ✅ 完成 | X 秒 |
| 提取研究设计 | ✅ 完成 | X 秒 |
| 提取核心结果 | ✅ 完成 | X 秒 |
| 生成 summary.md | ✅ 完成 | X 秒 |
## Vision 子 Agent 完成报告
**开始时间**: YYYY-MM-DD HH:MM
**完成时间**: YYYY-MM-DD HH:MM
**耗时**: X 分钟
### 执行结果
- ✅ 成功上传 X/Y 张图片
### 图片上传清单
| Figure | file_token | 大小 | 插入位置 | 状态 |
|--------|------------|------|----------|------|
| Fig. 1 | `xxx...` | XXX KB | 4.1 章节后 | ✅ |
### 输出文件
- `$PAPER_DIR/progress/vision.log` (进度日志)
### 问题与备注
<如有问题,在此说明>
### 详细进度
| 步骤 | 状态 | 耗时 |
|------|------|------|
| 获取 blocks 列表 | ✅ 完成 | X 秒 |
| 上传 Fig. 1 | ✅ 完成 | X 秒 |
| 上传 Fig. 2 | ✅ 完成 | X 秒 |
| 上传 Fig. 3 | ✅ 完成 | X 秒 |
| 验证图片数量 | ✅ 完成 | X 秒 |
## Reviewer 子 Agent 完成报告
**开始时间**: YYYY-MM-DD HH:MM
**完成时间**: YYYY-MM-DD HH:MM
**耗时**: X 分钟
**审核模型**: <模型名称>
### 执行结果
- ✅ 审核通过 / ⚠️ 需要修改
### 审核统计
- 一致的内容:X 处
- 需要修改的内容:Y 处
- 格式问题:Z 处
### 输出文件
- `$PAPER_DIR/progress/reviewer.log` (进度日志)
- `$PAPER_DIR/audit_report.md` (审核报告全文)
### 关键问题
<如有严重问题,在此说明>
### 修改建议清单
1. <具体修改建议 1>
2. <具体修改建议 2>
...
### 详细进度
| 步骤 | 状态 | 耗时 |
|------|------|------|
| 读取原始数据 | ✅ 完成 | X 秒 |
| 读取总结内容 | ✅ 完成 | X 秒 |
| 数据一致性核对 | ✅ 完成 | X 秒 |
| 格式检查 | ✅ 完成 | X 秒 |
| 生成审核报告 | ✅ 完成 | X 秒 |
# 关键步骤确认函数
confirm_step() {
local step_name=$1
local log_file=$2
log_master "🔍 确认步骤:$step_name"
if [[ ! -f "$log_file" ]]; then
log_master "❌ 日志文件不存在:$log_file"
return 1
fi
# 检查是否有 ERROR
if grep -q "\[ERROR\]" "$log_file"; then
log_master "❌ 检测到错误,查看错误日志"
cat "$log_file" | grep "\[ERROR\]"
return 1
fi
# 检查是否完成
if grep -q "✅ 完成\|\[SUCCESS\]" "$log_file"; then
log_master "✅ 步骤确认成功:$step_name"
return 0
else
log_master "⚠️ 步骤未完成:$step_name"
return 1
fi
}
# 使用示例(在每个阶段完成后调用)
# confirm_step "Reader 完成" "$PAPER_DIR/logs/reader.log" || exit 1
# confirm_step "Vision 完成" "$PAPER_DIR/logs/vision.log" || exit 1
# confirm_step "Reviewer 完成" "$PAPER_DIR/logs/reviewer.log" || exit 1
技能会自动从 ~/.openclaw/openclaw.json 中查找支持图片输入的模型:
# 自动识别逻辑
VISION_MODEL=$(jq -r '
.models.providers | to_entries[] |
.value.models[] |
select(.input and (.input | index("image"))) |
.id |
first
' "~/.openclaw/openclaw.json")
识别逻辑:
input 字段包含 "image" 的模型model.primary如何判断模型是否支持图片:
查看 models.providers[].models[] 中的 input 字段:
{
"models": {
"providers": {
"qwencode": {
"models": [
{
"id": "qwen3.5-plus",
"name": "Qwen3.5 Plus",
"input": ["text", "image"] ← 支持图片
}
]
}
}
}
}
优点:
共 1 个版本