← 返回
未分类

Community Data Process

北汽社群数据导出:数据清洗 → 数据校对 → 数据合并。 从客户群导出文件中筛选温冷一期和试点店标签数据, 校对关键指标一致性,增量合并到 BI_社群数据上传表。 统计日期使用源文件创建时间(下载日期)。 每天 00:55 自动执行。
北汽社群数据导出:数据清洗 → 数据校对 → 数据合并。 从客户群导出文件中筛选温冷一期和试点店标签数据, 校对关键指标一致性,增量合并到 BI_社群数据上传表。 统计日期使用源文件创建时间(下载日期)。 每天 00:55 自动执行。
yuhui435 yuhui435 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 398
下载
💾 5
安装
1
版本
#latest

概述

北汽社群数据导出

每日社群数据导出 → 清洗 → 校对 → 合并到 BI 系统。

流程概览

1. 数据清洗 → 2. 数据校对 → 3. 数据合并 → 4. 最终验证

使用方式

一键执行全流程

python ~/.openclaw/workspace-pm/skills/community-data-process/run.py

分步执行

# 第 1 步:数据清洗
python ~/.openclaw/workspace-pm/skills/community-data-process/run.py clean

# 第 2 步:数据校对
python ~/.openclaw/workspace-pm/skills/community-data-process/run.py audit

# 第 3 步:数据合并
python ~/.openclaw/workspace-pm/skills/community-data-process/run.py merge

# 第 4 步:最终验证
python ~/.openclaw/workspace-pm/skills/community-data-process/run.py verify

规则

清洗规则

  • 源文件:Downloads 目录下按创建时间(下载时间)排序,取最新的 客户群导出*.xlsx
  • 筛选条件:O 列(群标签)= 温冷一期 或 试点店
  • 数字列格式转换:群人数、员工人数、客户人数、今日入群、今日退群、今日消息 → int

校对规则

  • 三方对比:源文件 vs 清理后 vs 合并后
  • 8 个指标全部一致才通过
  • 数据质量:无空值、无负值

合并规则

  • 模式:增量添加(不去重)
  • 列映射:源文件 A-O 列 → 目标文件 E-S 列
  • D 列统计日期 = 源文件的创建时间(下载日期),文件是哪天下载的就填哪天(不是脚本执行日期)
  • A-C 列留空

列映射

源文件目标文件列名
-------------------------
AE群 ID
BF群名称
CG群主
DH群管理员
EI群人数
FJ群活跃
GK群类型
HL员工人数
IM客户人数
JN今日入群
KO今日退群
LP今日消息
MQ入群时间
NR最后发言时间
OS群标签

输出文件

文件说明
------------
客户群导出_清理后_温冷一期 + 试点店_YYYYMMDD.xlsx清洗后数据
BI_社群数据上传_已更新_YYYYMMDD.xlsx合并后最终文件
数据校对报告_YYYYMMDD.txt校对报告

常见问题

Q1: 今日退群数据不一致

检查是否使用了正确的源文件。不同日期导出的文件数据不同。

Q2: 统计日期错误

脚本自动读取源文件的下载日期,不需要手动指定。

Q3: 数字列显示为文本

脚本自动转换 6 个数字列为 int 格式。

依赖

  • Python 3.11+
  • pandas
  • openpyxl

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-31 04:19 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 297 📥 141,303
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 211 📥 69,028
ai-agent

Context Monitor

yuhui435
实时监控OpenClaw上下文窗口占用,超过阈值自动压缩旧对话并保留最近50轮及关键记忆,保持系统响应速度。
★ 0 📥 709