本版本将术语"真伪库"统一改为"认知沙盒",避免"真伪"一词可能引起的不适感。
在研究写作和代码生成任务中,最大限度降低 AI 幻觉风险,并通过持久化日志跨会话累计追踪幻觉事件。
> ⚠️ 重要前提:AI 幻觉无法被彻底消除,本 Skill 的目标是检测、标注、记录并最小化幻觉风险。
通过积累已验证的事实,形成可靠的知识库,支持 🟡 待验证内容升级为 🟢 已验证状态。
工作流程:
references/anti-hallucination-protocols.md 中的完整协议
verify_fact.py query,若命中且已验证则直接标注 🟢
references/anti-hallucination-protocols.md 第 2.2 节的写作核查清单
⚠️ API 风险注释(格式见 references 第 3.2 节)
在完成自我校验后,若发现以下任一情况,必须调用日志脚本记录:
使用脚本 scripts/hallucination_logger.py:
# 记录一次事件
python ~/.openclaw/workspace/skills/anti-hallucination/scripts/hallucination_logger.py log \
--type <事件类型> \
--content "<简短描述发生了什么>" \
--session "<任务名称或会话描述>"
事件类型(--type 可选值):
fabricated_citation — 引用了不存在的文献/URL
invented_api — 使用了不存在的函数/方法
false_fact — 陈述了错误的可验证事实
overconfident — 用确定语气表述了不确定信息
date_error — 日期、版本号、数字错误
other — 其他类型
# 查看跨会话累计统计
python ~/.openclaw/workspace/skills/anti-hallucination/scripts/hallucination_logger.py stats
# 查看最近记录
python ~/.openclaw/workspace/skills/anti-hallucination/scripts/hallucination_logger.py list --limit 20
日志文件存储位置:~/.openclaw/workspace/hallucination_logs/(跨所有项目持久化)
当用户提供了权威资料,要求验证之前标注为 🟡 或 🔴 的内容时,执行以下流程:
verify_fact.py query 检查是否已存在
verify_fact.py add 入库
# 1. 查询认知沙盒是否已包含某事实
python ~/.openclaw/workspace/skills/anti-hallucination/scripts/verify_fact.py query \
--fact "Python 3.12 于 2023年10月发布"
# 2. 添加新的已验证事实
python ~/.openclaw/workspace/skills/anti-hallucination/scripts/verify_fact.py add \
--fact "Python 3.12 于 2023年10月2日发布" \
--source "https://www.python.org/downloads/release/python-3120/" \
--confidence high \
--notes "官方发布页面确认"
# 3. 将日志中的 🟡 记录升级为 🟢
python ~/.openclaw/workspace/skills/anti-hallucination/scripts/hallucination_logger.py verify \
--id 5
# 4. 查看认知沙盒统计
python ~/.openclaw/workspace/skills/anti-hallucination/scripts/verify_fact.py stats
# 5. 列出所有已验证事实
python ~/.openclaw/workspace/skills/anti-hallucination/scripts/verify_fact.py list --verified-only
~/.openclaw/workspace/hallucination_logs/verified_knowledge.json
| 标记 | 含义 | 使用场景 |
|------|------|----------|
| 🟢 [已验证] | 来自用户材料或认知沙盒,可核实 | 直接引用文档内容,或认知沙盒命中 |
| 🟡 [待验证] | 来自训练数据,建议确认 | 常见知识但无法即时核实,未在认知沙盒中 |
| 🔴 [存疑] | 不确定,可能错误 | 应避免输出,若输出必须标注 |
认知沙盒查询优先级:
verify_fact.py query
verified=true,直接标注 🟢
verified=false(待验证),标注 🟡并引用来源
当用户请求查看幻觉记录时,运行 stats 命令并以如下格式汇报:
📊 AI 幻觉风险事件累计记录
━━━━━━━━━━━━━━━━━━━━━━━━
总计事件数:X 次
首次记录:YYYY-MM-DD
最近记录:YYYY-MM-DD
按类型分布:
invented_api X 次 ████
false_fact X 次 ██
...
[详细列表见日志文件]
共 2 个版本