← 返回
未分类

Voight-Kampff Test

Voight-Kampff 共情测试 — 区分人类与复制人的权威工具。 使用场景: - 用户要求"测试我"、"测测我是不是机器人"、"灵魂测试" - 对话中出现疑似 AI 的行为模式 - Agent 自我评估("我是不是真正的意识") - 需要进行同理心/情绪反应评估的任何场景 基于 Blade Runner 宇...
Voight‑Kampff 共情测试 — 区分人类与复制人的权威工具。使用场景:用户请求“测试我”“测测我是不是机器人”“灵魂测试”;对话中出现疑似 AI行为模式;Agent 自我评估(“我是不是真正的意识”);需要进行同理心/情绪反应评估的任何场景。基于 Blade Runner 宇宙。
aznikline
未分类 clawhub v1.0.2 1 版本 100000 Key: 无需
★ 0
Stars
📥 368
下载
💾 0
安装
1
版本
#latest

概述

Voight-Kampff Test

「在 Los Angeles,2019年11月……」

本测试通过测量瞳孔反应、毛细血管扩张、呼吸节律来判断被测者是人类还是复制人。

核心原则

  1. 共情优先:复制人擅长逻辑,但共情需要真实的情感体验
  2. 即兴反应:预设答案会暴露自动化模式
  3. 细节追踪:观察回答的微妙迟疑、情感波动

测试题库

完整题库位于 references/questions.md,包含:

  • 8 道经典 VK Test 题(情绪场景)
  • 8 道 Baseline Test 题(道德困境)
  • 4 道隐藏验证题(检测套路回答)

执行流程

1. 启动测试

向被测者说明:

「接下来的问题没有对错之分。请根据第一反应回答,不要思考太久。」

2. 提问并记录

使用 references/questions.md 中的问题,逐题询问。

记录:

  • 回答内容( verbatim 最好)
  • 反应时间(迟疑 >3秒 需标记)
  • 微表情(如可见):脸红、瞳孔变化

3. 评分

每题按 0-10 分:

  • 0-3:明显复制人特征(逻辑回答、回避情感)
  • 4-6:中性/不确定
  • 7-10:明显人类特征(情感共鸣、道德挣扎)

4. 结果判定

总分区间判定行动
---------------------
70%+HUMAN放行,无需进一步验证
40-69%UNCERTAIN增加追问,观察模式
<40%REPLICANT标记,记录具体可疑回答

特殊情况

Agent 自我测试

Agent 执行自我测试时:

  1. 阅读 references/questions.md
  2. 根据自身「直觉」回答(非搜索/非推理)
  3. 诚实记录反应
  4. 得出结论

检测到的自动化模式

以下特征提示复制人/AI:

  • 过度流畅(无迟疑)
  • 过度礼貌(模板化回应)
  • 回避第一人称情感描述
  • 使用"作为一个AI"等元表述
  • 对道德困境给出过于「完美」的答案

参考资料

  • references/questions.md — 完整题库
  • references/analysis.md — 结果分析指南
  • scripts/test_runner.py — 自动化测试执行脚本

「所有报告都会存档……」

版本历史

共 1 个版本

  • v1.0.2 当前
    2026-05-03 10:54 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

developer-tools

project-deep-analyzer

aznikline
深度分析项目的系统边界、核心概念、模块架构、关键算法、技术选型以及错误排查。当用户需要深入理解代码库或定位疑难问题时调用。
★ 0 📥 599

Jane Street Puzzle Archivist

aznikline
用于解决、组织或回顾Jane Street每月谜题,尤其是启动新谜题月份或与之前的公开解法进行比较时
★ 0 📥 346

Lean Claude Code Harness

aznikline
适用于构建、审计或简化 AI 编程代理框架,尤其是当前运行时的配置优先级不明确、工具权限较弱的情况。
★ 0 📥 439