> 作者: WuWenBin-BeiJing-ST
>
> 2026 年,基础的数据分析涉及到数据清洗和数据整理,这些工作应该交给 Skills 自动完成。本 Skill 提供标准数据分析全流程能力——从原始数据到专业报告,一键搞定。
基础的数据分析涉及到数据清洗和数据整理,2026 年,这些基础工作应该交给 Skills。本 Skill 需要完成数据分析能力,能够自动制作图表(柱状图、饼状图、带数据标记的折线图、条形图),数据分析能力具备:
本 Skill 提供端到端数据分析能力,涵盖从原始数据到专业报告的完整流程:
# Step 1: 执行数据分析(EDA + 清洗 + 统计 + 图表)
python3 scripts/analyze.py <数据文件路径> --output-dir ./output
# Step 2: 生成 Word 报告(洞察文本由 Agent 调用 Kimi/DeepSeek 生成)
python3 scripts/export_report.py ./output/summary.json "<AI洞察文本>" --output ./报告.docx
用户上传数据文件
↓
[1] 加载数据(CSV/Excel/JSON)
↓
[2] EDA 探索性分析
↓
[3] 数据清洗(自动 + 日志记录)
↓
[4] 统计分析(数值 + 分类)
↓
[5] 可视化(自动生成四类图表)
↓
[6] AI 洞察生成(调用 Kimi/DeepSeek)
↓
[7] 导出 Word 报告
↓
返回报告文件给用户
详细流程说明见 references/workflow.md。
scripts/analyze.py功能: 数据分析核心脚本,执行 EDA、清洗、统计、图表生成。
用法:
python3 scripts/analyze.py <数据文件> [--output-dir <输出目录>]
输出:
summary.json — 完整分析结果(EDA、清洗日志、统计、图表路径)charts/*.png — 自动生成的可视化图表依赖: pandas, matplotlib, numpy, openpyxl
scripts/export_report.py功能: 生成 Word 格式数据分析报告。
用法:
python3 scripts/export_report.py <summary.json路径> "<洞察文本>" [--output <报告路径>]
输出: 专业排版的 Word 文档,包含封面、数据概览、清洗记录、统计分析、图表、AI 洞察、结论建议。
依赖: python-docx
本 Skill 需 Agent 调用外部大模型(Kimi 或 DeepSeek)生成自然语言洞察。
详细调用方式、Prompt 模板、环境变量配置见 references/insight_generation.md。
关键配置:
# Kimi API Key
export KIMI_API_KEY="your-kimi-api-key"
# DeepSeek API Key
export DEEPSEEK_API_KEY="your-deepseek-api-key"
| 图表类型 | 适用场景 | 自动生成条件 |
|---|---|---|
| --------- | --------- | ------------- |
| 柱状图 | 数值分布、分类频次 | 数值列最多 3,分类列最多 2 |
| 饼状图 | 分类占比 | 分类列唯一值 ≥ 2,最多 2 列 |
| 折线图 | 数值趋势(带数据标记) | 数值列数据点 ≥ 2,最多 3 列 |
| 条形图 | 分类排名(水平) | 分类列唯一值 ≥ 2,最多 2 列 |
所有图表自动适配中文字体(PingFang SC / SimHei / Microsoft YaHei 等)。
| 格式 | 扩展名 | 编码处理 |
|---|---|---|
| ------ | -------- | --------- |
| CSV | .csv | 自动尝试 utf-8 / utf-8-sig / gbk |
| Excel | .xlsx, .xls | 自动读取,支持多 Sheet(默认第一个) |
| JSON | .json | 支持数组格式、对象数组、键值对映射 |
当用户触发本 Skill 时,按以下步骤执行:
summary.json 和图表错误处理:
pip3 install pandas matplotlib numpy openpyxl python-docx共 2 个版本