data-analysis-operation 技能提供了一个全面的数据分析和操作工具箱,专门用于处理和分析各种数据文件(Excel、CSV、TSV等)。它集成了数据分析、数据清洗、列对比和报告生成等功能,适用于数据质量评估、业务分析、数据清洗和洞察发现等场景。
当用户提到以下关键词时,此技能会自动触发:
# 数据分析模式
python scripts/data_analysis_operations.py analyze <文件路径> [选项]
# 列对比模式
python scripts/data_analysis_operations.py compare <文件路径> <列1> <列2>
# 数据清洗模式
python scripts/data_analysis_operations.py clean <文件路径> [选项]
# 查看帮助
python scripts/data_analysis_operations.py --help
# 详细数据分析
python scripts/analyze_data.py <文件路径> [--focus <重点关注列>]
# 列对比分析
python scripts/compare_columns.py <文件路径> <列1> <列2>
--sheet <工作表名>: 指定 Excel 工作表
--encoding <编码>: 指定文件编码(默认自动检测)
--output <输出目录>: 指定输出目录
--focus <列名>: 重点关注特定列
--format <格式>: 输出格式(excel/text/markdown)
主脚本 - 提供统一的命令行界面,包含所有核心功能:
analyze: 完整的数据分析
compare: 列对比分析
clean: 数据清洗操作
report: 生成分析报告
详细数据分析脚本 - 提供深度数据分析功能:
列对比脚本 - 专门用于列对比分析:
自动检测和处理的编码:
_analysis.xlsx)
_analysis_summary.txt)
_analysis_report.md)
# 分析 CSV 文件
python scripts/data_analysis_operations.py analyze sales_data.csv --focus "Sales" "Profit"
# 分析 Excel 文件指定工作表
python scripts/data_analysis_operations.py analyze sales.xlsx --sheet "Q1" --output reports/
# 对比两列数据
python scripts/data_analysis_operations.py compare customers.csv "Customer_ID" "Email"
# 使用列索引对比
python scripts/data_analysis_operations.py compare data.xlsx "A" "B"
# 清理数据并生成清洗报告
python scripts/data_analysis_operations.py clean messy_data.csv --output cleaned/
# 处理编码问题并清理
python scripts/data_analysis_operations.py clean data.csv --encoding gbk --remove-duplicates
安装依赖:
pip install pandas numpy openpyxl matplotlib
--encoding 参数
--sample 参数先分析样本
--encoding gbk 或 --encoding latin1
--sample 1000 先分析样本
--list-columns 查看所有列名
如需帮助或发现问题,请参考技能文档或联系技能开发者。
共 3 个版本