概述

用户使用数据可视化分析

概述

将用户使用行为原始数据（Excel/CSV），经过清洗、聚合、可视化三个阶段，产出单文件 HTML 报告。

报告包含：核心指标卡、多维度交叉筛选器、折线趋势图、能力排行图、分组对比表格。

交付物为自包含 HTML，可直接通过浏览器打开或发送给同事，无需服务器。

前置条件

确认用户提供以下信息：

数据源文件路径 — 使用明细 Excel/CSV（必须含：用户标识列、时间列、各能力使用次数列）
用户信息表路径（可选）— 含身份维度字段（部门、产品线、角色、大区、用户角色、层级等）
离职名单路径（可选）— 用于排除已离职人员
分析维度（可选）— 默认按部门+角色+产品线+大区+用户角色+层级，用户可按需调整
时间范围（可选）— 默认全部数据，用户可指定财周/月份范围

执行流程

第一步：数据加载与清洗

调用 scripts/load_and_clean.py：

python scripts/load_and_clean.py --input <使用明细.xlsx> --users <用户信息.xlsx> --resigned <离职名单.csv> --output data/cleaned_data.json

清洗规则：

排除离职名单中的用户
将能力使用次数列转为数值，空值填充为 0
日期列解析为 datetime，计算财周归属
去除完全重复行
活跃定义：该周任意能力使用次数 > 0

输出格式（JSON）：

{
  "columns": ["姓名", "角色", "用户角色", "财周", "能力一使用次数", ...],
  "data": [[...], ...],
  "meta": {"total_rows": 12000, "cleaned_rows": 11500, "removed_resigned": 500}
}

第二步：多维度聚合

调用 scripts/aggregate_data.py：

python scripts/aggregate_data.py --input data/cleaned_data.json --output data/aggregated.json --dimensions "部门,角色,产品线,大区,用户角色,层级"

聚合产出三个结构：

identity（身份维度）：按各身份字段 groupby，计算用户数、活跃用户数、活跃率、人均能力数、总使用次数
timeline（时间维度）：按财周聚合，计算每周活跃用户数、活跃率，支持与上一周期对比
capability（能力维度）：按能力名称聚合，计算使用用户数、使用频次、渗透率（使用人数/总人数）

第三步：生成 HTML 报告

调用 scripts/sync_to_html.py：

python scripts/sync_to_html.py --data data/aggregated.json --template assets/report_template.html --output output/report.html

实现方式：

读取 assets/report_template.html 模板
找到 const DATA = __DATA_PLACEHOLDER__; 占位符
用聚合结果 JSON 替换占位符
写出完整 HTML 文件

第四步：验证与交付

生成后执行验证：

用浏览器预览 HTML 确认渲染正常
检查核心指标数字与原始数据一致（总数、活跃率）
确认筛选器交互正常（身份筛选 → 图表联动）
将输出文件路径告知用户

HTML 报告设计规范

页面结构（从上到下）

标题栏：报告名称 + 数据更新时间 + 数据范围说明
筛选栏：身份维度下拉（部门/角色/产品线/大区/用户角色/层级）+ 时间范围选择 + 应用按钮
指标卡行：4 个核心数字（总用户数 / 活跃率 / 人均使用能力数 / 环比变化）
Tab 切换区：时间趋势 | 能力分析 | 身份对比 | 用户明细
图表区（根据 Tab 切换）：

时间趋势：折线图（周活跃率 + 上一周期对比线）
能力分析：横向条形图（各能力使用用户数排行）+ 渗透率指标
身份对比：分组表格（各身份的活跃率/人均能力/环比）
用户明细：可排序表格（用户标识 + 各维度 + 使用数据）

底部说明：数据口径说明 + 指标定义 + 活跃定义

视觉风格

图表库：Chart.js（CDN），无需安装
数据注入：const DATA = {...}; 内嵌 JSON，纯前端渲染
颜色规范：主色紫色系（#534AB7），正向指标绿色（#1D9E75），负向指标红色（#A32D2D）
布局：全屏宽，响应式，最大宽度 1400px 居中
字体：系统默认（Segoe UI / PingFang SC / Microsoft YaHei）

质量控制

若清洗后数据行数 < 原始数据 50%，输出警告并询问用户确认
空值率 > 20% 的列须在报告中标注
活跃率计算须注明口径：活跃用户数 / 总用户数（排除离职）
环比计算须确保有可比周期数据，否则显示 "N/A"

输出物

| 产物 | 路径 | 说明 |

|------|------|------|

| 清洗后数据 | data/cleaned_data.json | 中间产物，可复用 |

| 聚合结果 | data/aggregated.json | 中间产物，可复用 |

| 可视化报告 | output/report.html | 最终交付，单文件自包含 |

资源说明

scripts/

| 文件 | 用途 | 来源 |

|------|------|------|

| load_and_clean.py | 数据加载 + 清洗 + 转JSON | 基于 process_matrix.py 改造 |

| aggregate_data.py | 多维度聚合（身份/时间/能力） | 基于 generate_full_data.py 改造 |

| sync_to_html.py | JSON 数据注入 HTML 模板 | 基于 sync_html_data.py 通用化 |

| run_pipeline.py | 一键串联上述三步 | 新增 |

references/

| 文件 | 用途 |

|------|------|

| data_dict.md | 字段说明（列名含义、数据类型、取值范围） |

| indicator_defs.md | 指标定义（活跃率/渗透率/人均能力数等计算公式） |

assets/

| 文件 | 用途 |

|------|------|

| report_template.html | HTML 可视化报告模板（含 Chart.js、筛选器、图表占位） |

版本历史

共 2 个版本

v1.0.1 Initial release 当前

2026-05-13 14:48 安全安全
v1.0.0 Initial release

2026-05-13 14:20 安全安全

安全检测

腾讯云安全 (Keen)

安全，无风险

查看报告

腾讯云安全 (Sanbu)