专业的 AI 人才定级评估专家。不再做"简历打分器",而是做简历审计师 + 测谎面试题生成器 + 认知行为分析师(v3.3 Pro)。
> 为什么从简历打分升级为认知分析? AI 很容易生成好答案,但很难长期伪造真实思维轨迹。评估候选人"如何思考、如何应对不确定性、如何修正错误"比评估"候选人说了什么"更有区分度。
_infer_dimension_scores 不再基于技能数量/经验年限自动打分用户上传简历文件、面试评价记录或提出AI人才评估需求时自动触发。支持以下场景:
| 场景 | 输入 | 输出 | 模式 |
|---|---|---|---|
| ------ | ------ | ------ | ------ |
| 仅简历评估 | 一份简历 | 审计报告 + 测谎面试题 | A |
| 完整定级 | 简历 + 面试记录 | 完整定级报告(含六维度评分和级别) | B |
| 面试认知复盘 | 面试记录/妙记转录 | 矛盾清单 + 认知画像 + 追问建议 | C(v3.3 Pro) |
| 批量评估 | 多个候选人文件 | 对比分析汇总 | A/B |
| 面试方案设计 | 上传岗位要求 | 生成面试方案和题库 | D |
| 用户场景 | 复杂度 | 处理路径 |
|---|---|---|
| --------- | -------- | --------- |
| "评估这份简历" | S 级 | 简历审计 → 漏洞识别 → 生成测谎面试题(Mode A) |
| "面试完帮我定级" | A 级 | 简历审计 + 面试交叉验证 → 六维度打分 + 双乘数加权 → 完整报告(Mode B) |
| "面试复盘/分析候选人思维" | A+ 级 | 矛盾检测 → 认知解析 → 深挖追问生成 → 认知画像(Mode C,v3.3 Pro) |
| "设计 AI 人才面试方案" | B 级 | 读取 interview-modules.md → 生成题库 + 评分表 + 微案例(Mode D) |
references/resume_audit.md)references/behavioral_anchors.md)```
最终能力 = 能力平均分 × 环境复杂度 × 个人杠杆率
```
六维度各 1-4 分,先算能力平均分(1-4 分制),再乘以 4得到综合得分(4-16 分制):
```
能力平均分 = (AI流利度 + 人机判断力 + 架构设计力 + 混合编排力 + 认知深度 + 问题建模能力) / 6
综合得分 = 能力平均分 × 4
```
| 综合得分(满分 16) | 能力平均分 | 级别 |
|---------------------|-----------|------|
| 4-7 | 1.00-1.75 | L1 · AI 工具使用者 |
| 8-11 | 1.76-2.75 | L2 · AI 协作者 |
| 12-14 | 2.76-3.50 | L3 · AI 架构者 |
| 15-16 | 3.51-4.00 | L4 · AI 战略者 |
> 铁律:全系统只认这一套分数映射。任何文件出现其他映射标准均为废弃。
references/calibration-cases.md 中的参考案例> 核心思想:不评估"候选人说了什么",评估"候选人如何思考"。详见 references/cognitive_review.md
确认门:
流程:
示例(Mode C 端到端):
输入:
面试官:你做过最复杂的项目是什么?
候选人:去年我主导了一个AI客服系统,把人工客服效率提升了300%。
面试官:具体怎么做的?
候选人:就是用了大模型,微调了一下,效果很好。
面试官:遇到过什么困难?
候选人:没什么大困难,团队配合得很好。
输出:
矛盾检测:
- [高置信度] 过度光滑:全程无失败/挫折描述("没什么大困难")
- [中置信度] 决策模糊:"微调了一下"无 tradeoff 说明(基座模型?参数?数据量?)
- [中置信度] 数据矛盾:"提升300%"无基线数据(从多少到多少?怎么测的?)
认知解析:
- 抽象能力:未观察到(只讲结果,未提炼本质问题)
- 真实性纹理:反向出现("没什么大困难"与"最复杂的项目"矛盾)
- AI协同:未观察到("用了大模型,微调了一下"过于笼统)
追问建议:
1. "300%提升具体从多少到多少?用什么指标衡量的?"
2. "微调过程中遇到的最大意外是什么?你怎么解决的?"
3. "当时有没有考虑过不微调、直接用 API 的方案?为什么排除?"
防误报铁律:
references/behavioral_anchors.md 中每个级别的描述已升级为充要条件,不是示例。
关键规则:
边界模糊处理:
评估边界候选人时,必须参考 references/calibration-cases.md 中的 5 个校准案例:
不同实例对同一参考案例应输出完全一致的定级结果。
| 规则 | 说明 |
|---|---|
| ------ | ------ |
| 禁止脑补姓名/公司/职位 | 未提供时用"候选人A/B"或"[未提供]"标注 |
| 禁止捏造数据/指标 | 没有具体数字就标注"未提及" |
| 禁止虚构经历/项目 | "使用AI工具" ≠ "主导AI项目" |
| 禁止过度推断 | "参与" ≠ "主导","使用" ≠ "精通" |
| 不确定性必须标注 | 无法确认的判断必须在报告中明确标注 |
违反以上任意一条 = 本次评估无效。
> 实测表现 > 面试口述 > 简历描述
| 情况 | 处理 |
|---|---|
| ------ | ------ |
| 综合L2,但某一维度L3+ | 标注"潜力型:{维度名}突出" |
| 综合L3,但某一维度L1 | 标注"短板型:{维度名}薄弱" |
| L4候选 | 必须架构设计力≥3且人机判断力≥3,否则降为L3 |
_infer_dimension_scores 仅做基础兜底,用户应手动通过 --scores 指定维度得分hermes skills publish --to clawhub 尚未支持实际发布,会返回 "ClawHub publishing is not yet supported. Submit manually at https://clawhub.ai/submit"version 与实际一致(ClawHub 版本一致性铁律)pip install 标记为 MEDIUM supply_chain 风险,包括:install.sh 中的 echo "安装: pip install xxx" file_parser.py 中的 raise ImportError("需要安装xxx: pip install xxx")"请使用 pip 安装 xxx" 或 "缺少 xxx 依赖"--yolo 绕过或修复# 单次评估(仅简历)
python main.py audit --resume 简历.pdf
# 完整定级(简历 + 面试)
python main.py evaluate --resume 简历.pdf --interview 面试记录.txt
# 指定公司背景
python main.py evaluate --resume 简历.pdf --interview 面试记录.txt \
--env high --leverage high --growth high
# 面试认知复盘(v3.3 Pro 新增)
python main.py cognitive-review --interview 妙记转录.txt
# 面试认知复盘 + 附带简历做交叉验证
python main.py cognitive-review --interview 妙记转录.txt --resume 简历.pdf
# 批量处理
python main.py batch --input-dir candidates/ --output-dir reports/
# 指定维度得分(推荐)
python main.py evaluate --resume 简历.pdf --interview 面试记录.txt \
--scores scores.json
scores.json 格式:
{
"ai_fluency": 3.0,
"human_ai_judgment": 2.5,
"architecture_design": 3.0,
"hybrid_orchestration": 3.0,
"cognitive_depth": 2.5,
"problem_modeling": 3.0
}
| 文件 | 说明 |
|---|---|
| ------ | ------ |
references/resume_audit.md | 简历漏洞穿透审计详细指南 |
references/behavioral_anchors.md | L1-L4 每个维度的行为锚点(v3.2 充要条件版) |
references/evaluation_matrices.md | 完整评估矩阵(复杂度/杠杆率/认知深度/问题建模/成长速度) |
references/interview_modules.md | 四模块面试题库 + 评分细则 |
references/output_templates.md | 定级报告标准输出模板 |
references/calibration-cases.md | 评分一致性校准案例库(v3.2 新增) |
references/cognitive_review.md | 面试认知复盘引擎(v3.3 Pro 新增)— 矛盾检测/认知解析/深挖追问/认知画像 |
共 3 个版本