员工手册与制度问答机器人
基于 RAG(检索增强生成)的智能制度问答系统。HR 导入公司制度文档后,员工可用自然语言提问,AI 精准检索文档段落并生成回答,附带制度原文出处。
四大核心能力
1. 文档智能导入
- 支持 Word (.docx) 和 PDF (.pdf) 格式
- 自动识别文档标题、章节结构、表格内容
- 智能分块:按段落 + 语义边界切分,保留上下文
- 中文分词索引,支持模糊匹配和近义词检索
- 支持增量更新:同一文档重复导入自动覆盖旧版
2. 自然语言问答
- 员工用大白话提问,无需知道"条款编号"
- 多策略检索:关键词匹配 + TF-IDF 语义相似度 + 章节范围加权
- 返回 Top-K 相关段落,按相关度排序
- 每个答案附带文档名称 + 章节位置引用链接
3. 文档管理
- 查看已导入文档列表及统计信息
- 按分类管理(员工手册、考勤制度、福利政策、报销制度等)
- 删除 / 更新指定文档
- 查看索引进度与覆盖率
4. 智能问答增强
- 自动识别问题类型(请假类、报销类、福利类、考勤类、综合类)
- 对于模糊问题,列出可能的匹配项让员工选择
- 制度有更新的情况,标注"最后更新时间"
- 回答结构化:核心回答 + 详细说明 + 原文引用
AI 使用此 Skill 的工作流程
场景 1:首次导入文档
当用户说"导入员工手册"/"上传制度文档"时:
- 确认文件路径 — 如果用户提供了文件路径,直接使用;否则请用户提供
- 确定分类 — 询问或自动推断文档分类(员工手册/考勤制度/福利政策/报销制度/其他)
- 运行导入脚本:
```bash
python ~/.workbuddy/skills/employee-handbook-qa/scripts/doc_importer.py \
--input "" \
--category "" \
--name ""
```
- 确认结果 — 向用户报告:导入段落数、文档大小、索引状态
场景 2:员工提问
当用户提出制度相关问题(如"陪产假怎么休?""加班餐补标准是多少?""年假怎么算?")时:
- 运行检索脚本:
```bash
python ~/.workbuddy/skills/employee-handbook-qa/scripts/qa_engine.py \
--query "<用户问题>" \
--top_k 5
```
- 读取检索结果(JSON 格式),获取 Top-K 相关段落
- 生成回答:
- 综合 Top-3 最相关段落,生成简洁准确的自然语言回答
- 标注信息来源:文档名称 + 章节位置
- 如果有多个制度涉及同一问题(如考勤制度+员工手册),同时引用
- 如果检索结果置信度低,诚实告知"制度文档中未找到相关内容"
- 格式要求:
```
📋 核心回答:[一句话结论]
📝 详细说明:[展开解释]
📎 制度依据:
- 《[文档名称]》第[X]章 - [章节标题]:[引用原文摘要]
```
场景 3:文档管理
当用户说"查看已导入文档"/"删除某文档"/"更新某文档"时:
- 运行
doc_manager.py --list 查看文档列表 - 根据用户意图执行相应操作(删/改)
- 报告操作结果
可视化风格
- 回答采用清晰的卡片式布局
- 制度引用使用引用块样式
- 检索置信度使用颜色标识:🟢高 🟡中 🔴低
- 对于模糊匹配,列出可能的候选项供员工进一步选择
关键原则
- 精准优先 — 只基于已导入文档回答,不编造制度内容
- 引用可追溯 — 每个回答必须附带制度原文出处
- 用户友好 — 用大白话解释,避免照搬条款编号
- 诚实透明 — 找不到相关制度时明确告知,建议联系HRBP
- 处理冲突 — 当多份文档对同一问题有不同规定时,以最新导入的为准,并提醒可能存在制度冲突