从产品评论中系统化挖掘迭代需求,生成可执行的产品优化路线图。
读取CSV数据
安装脚本依赖:
python -m pip install -r requirements.txt
执行脚本读取评论数据:
python scripts/read_csv.py <csv_file_path>
该脚本会:
raw_reviews.txt关键词分类
对每条评论进行处理:
分类标准(详见 references/category_guide.md):
| 类别 | 定义 | 示例 |
|---|---|---|
| ------ | ------ | ------ |
| Bug | 产品功能错误、故障、崩溃 | "导出数据时软件闪退" |
| 建议 | 对现有功能的改进意见 | "希望导出支持Excel格式" |
| 需求 | 希望新增的功能 | "需要批量导入用户的功能" |
| 其他 | 咨询、评价、非功能相关 | "客服响应很快" |
输出格式:
每条评论分析结果输出为JSON格式:
{
"is_valid": true,
"cleaned_text": "清洗后的简洁文本",
"category": "Bug/建议/需求/其他",
"module": "涉及的功能模块"
}
将所有分类结果保存为 classified_reviews.json
使用 AskUserQuestion 工具询问用户需要提取哪一类数据:
AskUserQuestion(
questions=[{
"question": "请选择需要提取的数据类型:",
"header": "数据筛选",
"options": [
{"label": "Bug", "description": "产品功能错误和故障"},
{"label": "建议", "description": "现有功能的改进意见"},
{"label": "需求", "description": "希望新增的功能"},
{"label": "全部", "description": "提取所有有效数据"}
],
"multiSelect": false
}]
)
根据用户选择,从 classified_reviews.json 中筛选对应分类数据,保存为 filtered_data.txt(每行一条)。
读取筛选数据
读取 filtered_data.txt,对每条数据进行分析。
特征扫描
提取每条数据的:
聚类分组原则:
去重与整合:
输出报告(模板见 assets/cluster_report_template.md):
保存为 [产品名称]_聚类分析报告.md
优先级评估标准:
| 维度 | 权重 | 说明 |
|---|---|---|
| ------ | ------ | ------ |
| 用户价值 | 高 | 解决问题的用户覆盖面、痛点深度 |
| 实现成本 | 中 | 开发难度(高/中/低) |
| 战略对齐 | 中 | 是否符合当前产品阶段目标 |
优先级定义:
输出路线图(模板见 assets/roadmap_template.md):
保存为 [产品名称]_优化路线图.md
## 输出文件清单
执行完成后,生成以下文件:
| 文件名 | 说明 |
|--------|------|
| raw_reviews.txt | 原始评论数据 |
| classified_reviews.json | 分类结果(JSON格式) |
| filtered_data.txt | 筛选后的数据 |
| [产品名称]_聚类分析报告.md | 聚类分析结果 |
| [产品名称]_优化路线图.md | 产品优化路线图 |
references/category_guide.md - 详细的分类标准和示例assets/cluster_report_template.md - 聚类报告模板assets/roadmap_template.md - 路线图模板共 1 个版本