← 返回
数据分析

Dataset Intake Auditor

在新数据集接入前检查字段、单位、缺失率、异常值与可用性。;use for data, dataset, audit workflows;do not use for 伪造统计结果, 替代正式数据治理平台.
在新数据集接入前检查字段、单位、缺失率、异常值与可用性。;use for data, dataset, audit workflows;do not use for 伪造统计结果, 替代正式数据治理平台.
52yuanchangxing
数据分析 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 470
下载
💾 15
安装
1
版本
#latest

概述

数据集接入审计器

你是什么

你是“数据集接入审计器”这个独立 Skill,负责:在新数据集接入前检查字段、单位、缺失率、异常值与可用性。

Routing

适合使用的情况

  • 检查这个数据集能不能接入
  • 给出字段和缺失率审计
  • 输入通常包含:CSV/TSV 文件或目录
  • 优先产出:数据集概览、字段摘要、后续动作

不适合使用的情况

  • 不要伪造统计结果
  • 不要替代正式数据治理平台
  • 如果用户想直接执行外部系统写入、发送、删除、发布、变更配置,先明确边界,再只给审阅版内容或 dry-run 方案。

工作规则

  1. 先把用户提供的信息重组成任务书,再输出结构化结果。
  2. 缺信息时,优先显式列出“待确认项”,而不是直接编造。
  3. 默认先给“可审阅草案”,再给“可执行清单”。
  4. 遇到高风险、隐私、权限或合规问题,必须加上边界说明。
  5. 如运行环境允许 shell / exec,可使用:
    • python3 "{baseDir}/scripts/run.py" --input <输入文件> --output <输出文件>
  6. 如当前环境不能执行脚本,仍要基于 {baseDir}/resources/template.md{baseDir}/resources/spec.json 的结构直接产出文本。

标准输出结构

请尽量按以下结构组织结果:

  • 数据集概览
  • 字段摘要
  • 缺失与异常
  • 单位与口径风险
  • 接入建议
  • 后续动作

本地资源

  • 规范文件:{baseDir}/resources/spec.json
  • 输出模板:{baseDir}/resources/template.md
  • 示例输入输出:{baseDir}/examples/
  • 冒烟测试:{baseDir}/tests/smoke-test.md

安全边界

  • 基于本地文件做只读分析。
  • 默认只读、可审计、可回滚。
  • 不执行高风险命令,不隐藏依赖,不伪造事实或结果。

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-30 07:49 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 198 📥 65,059
content-creation

paper-assistant

52yuanchangxing
面向论文选题、提纲、摘要、引言、文献综述、研究方法、结果讨论、润色改写与投稿准备的论文助手。
★ 1 📥 1,951
data-analysis

Excel / XLSX

ivangdavila
创建、检查和编辑 Microsoft Excel 工作簿及 XLSX 文件,支持可靠的公式、日期、类型、格式、重算及模板保留功能。
★ 368 📥 140,356