← 返回
数据分析

CSV Wizard

交互式数据清洗 CLI,支持自动类型推断、缺失值处理、重复检测
交互式数据清洗 CLI,支持自动类型推断、缺失值处理、重复检测
antonia-sz
数据分析 clawhub v1.0.1 1 版本 99848.9 Key: 无需
★ 0
Stars
📥 661
下载
💾 19
安装
1
版本
#latest

概述

CSV Wizard — 交互式数据清洗工具

强大的 CSV 数据清洗和转换工具,提供自动类型推断、缺失值处理、重复检测等功能。

功能特性

  • 🔍 自动类型推断(数字、日期、布尔值、分类变量)
  • 🧹 缺失值检测与多种填充策略
  • 📊 数据统计摘要与预览
  • 🔄 重复行检测与删除
  • 📝 列名标准化与重命名
  • 🎯 数据格式转换与导出

使用方法

基本清洗

/clean-csv data.csv --output clean-data.csv

交互式清洗(推荐)

/clean-csv data.csv --interactive

预览数据信息

/clean-csv data.csv --info

处理缺失值

/clean-csv data.csv --fill-missing mean --output result.csv

删除重复行

/clean-csv data.csv --drop-duplicates --output result.csv

选项说明

选项说明
------------
--info显示数据基本信息
--preview预览前 N 行数据
--fill-missing缺失值填充策略(drop/mean/median/mode/constant)
--drop-duplicates删除重复行
--standardize-names标准化列名(snake_case)
--interactive交互式模式
--output输出文件路径

缺失值填充策略

  • drop - 删除包含缺失值的行
  • mean - 使用列均值填充(仅数值列)
  • median - 使用中位数填充(仅数值列)
  • mode - 使用众数填充
  • constant - 使用固定值填充(需配合 --fill-value

示例

# 查看数据摘要
/clean-csv sales.csv --info

# 清洗数据:删除重复行 + 填充缺失值
/clean-csv sales.csv --drop-duplicates --fill-missing median --output clean-sales.csv

# 交互式清洗
/clean-csv data.csv --interactive

# 仅标准化列名
/clean-csv data.csv --standardize-names --output output.csv

输出说明

清洗后的 CSV 文件将保留原始格式,同时:

  • 自动处理编码问题(统一为 UTF-8)
  • 移除首尾空格
  • 标准化布尔值(True/False)

版本历史

共 1 个版本

  • v1.0.1 当前
    2026-03-31 06:06 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 198 📥 65,127
data-analysis

Excel / XLSX

ivangdavila
创建、检查和编辑 Microsoft Excel 工作簿及 XLSX 文件,支持可靠的公式、日期、类型、格式、重算及模板保留功能。
★ 368 📥 140,482
data-analysis

A股量化 AkShare

mbpz
A股量化数据分析工具,基于AkShare库获取A股行情、财务数据、板块信息等。用于回答关于A股股票查询、行情数据、财务分析、选股等问题。
★ 165 📥 60,029