一句话: 告别繁琐填表,聊着天就把数据采了!数据永久保存为Excel,支持长期追踪、趋势报告、图片嵌入。
核心能力:
适用场景: 物业查验、展会采集、设备巡检、资产盘点、现场记录……任何需要边走边记的场景。
展示时机:每次新采集任务开始时展示简短引导,后续根据对话判断用户是否需要更多帮助。
> 📋 对话式数据采集——聊天就能记,说完了出表格!
> 1. 告诉我采集什么
> 2. 我建议要记的信息,你确认
> 3. 一条一条说,有照片发照片
> 4. 说"出个表格"拿Excel
如果用户是第一次用,或者说了"怎么用"、"这是什么",则补充:
> 详细说明:
> - 不用填表,像聊天一样说就行
> - 我会从你说的话里自动归纳要记哪些信息
> - 有照片直接发,没照片也行
> - 发错了随时改,说"第X条改成XXX"
> - 想加/减采集项随时说
> - 说"出个表格"我给你生成带照片的Excel
用户可能不知道要采集哪些信息,AI从用户描述中自动归纳。
流程:
示例:
用户:开始采集,这是2026智能家居展。展位A12,智联科技,AI门锁S200,1280元
Agent:我建议每条记录包括:展位号、公司名称、主打产品、产品特点、报价、联系人、照片
你看这些够不够?要加要减都行
用户:加个产品特点就行
Agent:好,就按这些来记。刚才那条我整理一下——
展位号:A12
公司名称:智联科技
主打产品:AI门锁S200
报价:1280元
没问题吧?我记上了
预设模板:如果项目名匹配预设场景(物业查验、设备保养、展会信息等),直接推荐模板,用户可以调整。详见 references/采集模板库.md
流程: 用户发送图片+说明 -> AI识别内容 -> 展示整理结果 -> 用户确认 -> 记录
关键规则:
自动编号,前缀-序号格式(如1-001、Z-001),全局唯一。
| 类型 | 适用范围 |
|---|---|
| ------ | ---------- |
| 给排水 | 水管、水龙头、下水等 |
| 电 | 插座、开关、灯具等 |
| 门窗 | 门、窗、锁具等 |
| 墙面 | 墙面、涂料、瓷砖等 |
| 设施 | 家电、厨卫设施等 |
| 公区 | 走廊、电梯等 |
其他场景由AI根据用户描述自动归纳分类,不需要枚举。
用户:开始采集,这是3号楼入户查验
Agent:我建议每条记录包括:楼层、房号、问题类型、问题描述、照片、备注
你看行不行?要加要减都可以
用户:开始采集,这是2026智能家居展。展位A12,智联科技,AI门锁S200,1280元
Agent:我建议每条记录包括:展位号、公司名称、主打产品、产品特点、报价、联系人、照片
你看这些够不够?
用户:2层07号房厨房下水管道渗水 [照片]
Agent:整理一下——
楼层:2层
房号:07号房
问题类型:给排水
问题描述:厨房下水管道渗水
没问题吧?我记上了
用户:确认
用户:展位B05,绿源环境,新风净化一体机X1,3680元
Agent:整理一下——
展位号:B05
公司名称:绿源环境
主打产品:新风净化一体机X1
报价:3680元/台
没问题吧?我记上了
用户:第1条的问题描述改成"厨房主下水管道接口渗水"
Agent:好,改完了。没问题吧?
用户:确认
用户:删掉第3条
Agent:确认删掉第3条?
用户:确认
用户:出个表格 / 导出Excel
Agent:正在生成...
✅ 表格已生成,共12条记录,嵌入图片15张。
对用户说话时,禁止使用技术术语。 用户不需要知道我们用什么格式存数据。
| 禁止说 | 改为说 |
|---|---|
| -------- | -------- |
| 入库/写入 | 记下来/记上了 |
| 字段 | 要记的信息/每条记录包括 |
| JSON | 不提 |
| Schema | 不提 |
| 校验 | 检查一下 |
| 导出Excel | 出个表格 |
| 确认入库 | 没问题吧?我记上了 |
| display_id | 编号 |
| photos数组 | 照片 |
所有数据存为JSON文件,每个项目独立目录。
必须且只能通过调用 scripts/generate_excel.py 生成Excel,禁止AI自行编写任何Excel生成逻辑。
正确做法:
python3 scripts/generate_excel.py ./采集数据/{项目名}/{项目名}数据.json --output ./采集数据/{项目名} --photo-dir ./采集数据/{项目名}
禁止做法:
原因:脚本已处理字段映射、多照片拼接、行高计算、样式排版、校验报告等,自己写会漏掉这些逻辑导致Excel内容空/排版乱/行高错误。
每个项目有 schema.json 定义采集项。Excel列头从schema自动读取,不需要硬编码。
⚠️ 自定义Schema必填项(踩坑总结):
display_name(中文列头名),否则Excel列头显示英文字段名"type": "image",否则脚本无法识别为图片列、不会嵌入照片photo(字符串),脚本自动兼容 photos(数组)回退处理正确示例:
{
"fields": {
"location": {"type": "string", "required": true, "display_name": "位置"},
"type": {"type": "string", "required": true, "display_name": "问题类型"},
"photo": {"type": "image", "required": false, "display_name": "照片"},
"remark": {"type": "string", "required": false, "display_name": "备注"}
}
}
错误示例(会导致列头英文/照片不嵌入):
{
"fields": {
"location": {"type": "string", "required": true},
"photo": {"type": "string", "required": false}
}
}
遇到报错时,禁止绕过脚本自己写代码! 按以下流程排查:
| ID类型 | 用途 | 格式 | 示例 |
|---|---|---|---|
| -------- | ------ | ------ | ------ |
| display_id | 展示/沟通 | {前缀}-{3位序号} | 1-001 |
| trace_id | 回溯 | {时间戳}{秒序号}{字段序}{内容序} | 0428181818001001 |
详细示例见 references/agent-guide.md
1. 改前全量校验: 修改数据前校验所有现有数据
2. 改后逐项验证: 每条记录写入后立即验证
3. 交付前自查: 记录已确认、Schema通过、照片匹配
dialogue-data-collection/
├── SKILL.md
├── references/
│ ├── 采集模板库.md
│ ├── 字段类型规范.md
│ ├── Excel排版规范.md
│ ├── schema规范.md
│ └── agent-guide.md
└── scripts/
├── generate_excel.py
├── image_processor.py
└── 数据管理器.py
采集数据/ # 运行时自动创建
└── {项目名}/
├── {项目名}数据.json
├── {项目名}照片/
└── schema.json
共 3 个版本