> 构建领域业务标签体系,用于对拆分后的问答对及用户意图打标,配合事项分类体系实现"标签匹配→缩小召回范围→检索重排"的知识检索提升。
当用户提供一份包含源知识的 Excel 文件(3个Sheet:信息导出/问答导出/拆分后的知识),要求你:
| 维度 | 业务标签 | 事项分类 |
|---|---|---|
| ----- | --------- | --------- |
| 本质 | 这是什么业务 | 用户在问什么 |
| 层级 | 不固定 | 固定13类 |
| 作用 | 匹配业务范畴 | 判断意图类型 |
| 扩展 | 随领域增加而扩展 | 不扩展 |
在开始打标之前,向用户确认:
读取 Excel 文件,重点分析以下字段:
| Sheet | 重点字段 | 分析目的 |
|---|---|---|
| ------- | --------- | --------- |
| 信息导出 | 信息标题、正文内容、信息分类(三级归口) | 理解源知识覆盖了哪些业务场景 |
| 问答导出 | 问答标题、问答答案 | 理解QA对的知识结构 |
| 拆分后的知识 | 信息标题、问题、答案 | 分析拆分粒度是否合理,标签是否匹配 |
分析要点:
根据源知识内容,按以下逻辑构建:
1. 确定二级领域(可选)
如果该领域跨度大(如同时包含"中国公民业务"和"外国人业务"),先按主体区分二级领域。
2. 确定业务阶段(一级标签)
围绕该领域从起点到终点的业务流程阶段划分一级标签。
3. 细化场景标签(二级/三级标签)
在每个业务阶段下,根据知识的具体场景进一步细分。
| 原则 | 说明 |
|---|---|
| ----- | ------ |
| 知识颗粒度决定标签层级 | 如果某一业务阶段的知识高度集中在某一场景,标签到二级即可;如果覆盖多个场景,则扩展到三级 |
| 互斥性 | 同一级标签之间应互斥,不重叠 |
| 完整性 | 覆盖该领域的主要业务场景,有明确归属的知识都能找到对应标签 |
| 可打标性 | 标签颗粒度要与知识颗粒度匹配,确保大多数知识能有明确归属 |
窗口信息类问答归类(易错!易打入错误标签!):
| 问题类型 | 应归入标签 |
|---|---|
| --------- | ----------- |
| "办理地点/时间/是否支持在线办理" | 办理流程与查询-窗口与办理点查询 |
| "咨询电话/监督投诉电话" | 配套服务与咨询-咨询与投诉渠道 |
| "办理时限/承诺时限/法定时限" | 办理费用与时限-办理时限咨询 |
| "收费标准/收费依据" | 办理费用与时限-证件收费标准 |
| "需要哪些材料" | 对应业务阶段的材料准备标签 |
| "服务对象是谁/受理条件是什么" | 证件申办-申请资格咨询 |
| "办理流程是什么" | 办理流程与查询-窗口与办理点查询 |
| "如何咨询/如何投诉" | 配套服务与咨询-咨询与投诉渠道 |
| "审批结果/法律依据" | 其他问答(兜底) |
注意事项:
对拆分粒度或内容有问题的知识进行标注:
| 问题类型 | 处理方式 |
|---|---|
| --------- | --------- |
| 信息标题与问题内容不匹配 | 指出错误来源 |
| 同一信息拆分出过多无区分度问答 | 建议合并(如多个窗口信息逐条拆出) |
| 拆分与源信息正文不对应 | 指出来源核实问题 |
| 混入非本领域知识 | 标注应剔除 |
结构:
# [领域]领域标签体系
> 基于源知识文件构建,用于...
## 一、领域划分
## 二、标签体系
### 领域一:XXX
#### 1. 业务阶段A
- 标签1
- 标签2
...
### 领域二:XXX
...
## 三、标签与事项分类的区分说明
## 四、拆分知识校验意见
## 五、标签应用示例
在原Excel基础上增加"业务标签"列,对每条问答标注对应标签。
Q:标签层级是固定三级吗?
A:不是。标签层级由知识细粒度决定。如果该领域知识集中在某一类场景,可只到二级;如果覆盖多个阶段/场景,则扩展到三级或更深。参考公积金领域标签体系。
Q:窗口信息和业务标签冲突时以哪个为准?
A:窗口信息有独立的归类规则,不应打入业务主标签。例如"外国人签证的办理地点在哪里",应打"窗口与办理点查询",而非"签证与居留办理"。
Q:两个标签体系同时打标吗?
A:业务标签和事项分类是独立的两套标签体系,从不同维度对知识进行标注,匹配时也是独立匹配,互不冲突。
Q:知识拆分粒度不合理怎么办?
A:在标签体系文档的"拆分知识校验意见"章节中指正,说明问题类型和处理建议。
共 1 个版本