将用户使用行为原始数据(Excel/CSV),经过清洗、聚合、可视化三个阶段,产出单文件 HTML 报告。
报告包含:核心指标卡、多维度交叉筛选器、折线趋势图、能力排行图、分组对比表格。
交付物为自包含 HTML,可直接通过浏览器打开或发送给同事,无需服务器。
确认用户提供以下信息:
调用 scripts/load_and_clean.py:
python scripts/load_and_clean.py --input <使用明细.xlsx> --users <用户信息.xlsx> --resigned <离职名单.csv> --output data/cleaned_data.json
清洗规则:
输出格式(JSON):
{
"columns": ["姓名", "角色", "用户角色", "财周", "能力一使用次数", ...],
"data": [[...], ...],
"meta": {"total_rows": 12000, "cleaned_rows": 11500, "removed_resigned": 500}
}
调用 scripts/aggregate_data.py:
python scripts/aggregate_data.py --input data/cleaned_data.json --output data/aggregated.json --dimensions "部门,角色,产品线,大区,用户角色,层级"
聚合产出三个结构:
调用 scripts/sync_to_html.py:
python scripts/sync_to_html.py --data data/aggregated.json --template assets/report_template.html --output output/report.html
实现方式:
assets/report_template.html 模板
const DATA = __DATA_PLACEHOLDER__; 占位符
生成后执行验证:
const DATA = {...}; 内嵌 JSON,纯前端渲染
#534AB7),正向指标绿色(#1D9E75),负向指标红色(#A32D2D)
| 产物 | 路径 | 说明 |
|------|------|------|
| 清洗后数据 | data/cleaned_data.json | 中间产物,可复用 |
| 聚合结果 | data/aggregated.json | 中间产物,可复用 |
| 可视化报告 | output/report.html | 最终交付,单文件自包含 |
| 文件 | 用途 | 来源 |
|------|------|------|
| load_and_clean.py | 数据加载 + 清洗 + 转JSON | 基于 process_matrix.py 改造 |
| aggregate_data.py | 多维度聚合(身份/时间/能力) | 基于 generate_full_data.py 改造 |
| sync_to_html.py | JSON 数据注入 HTML 模板 | 基于 sync_html_data.py 通用化 |
| run_pipeline.py | 一键串联上述三步 | 新增 |
| 文件 | 用途 |
|------|------|
| data_dict.md | 字段说明(列名含义、数据类型、取值范围) |
| indicator_defs.md | 指标定义(活跃率/渗透率/人均能力数等计算公式) |
| 文件 | 用途 |
|------|------|
| report_template.html | HTML 可视化报告模板(含 Chart.js、筛选器、图表占位) |
共 2 个版本