← 返回
未分类

Salary Market Analysis

薪酬市场调研分析技能(增强版)。支持多源数据收集、24字段标准化CSV模板、年薪自动计算、分位值计算(P10-P90)、17章节专业报告生成、多格式输出(Excel/Markdown/Word)。
薪酬市场调研分析(增强版),支持多源数据收集、24字段标准CSV模板、年薪自动计算、分位值P10-P90、17章节报告生成、Excel/Markdown/Word输出。
tuobadaidai tuobadaidai 来源
未分类 clawhub v2.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 229
下载
💾 0
安装
1
版本
#latest

概述

薪酬市场调研分析 (Salary Market Analysis)

专业的薪酬市场调研工具,支持多源数据融合、数据清洗、分位值计算和专业报告生成。


✨ 功能特性

  • 24 字段标准化模板:覆盖基础信息、岗位信息、公司信息、薪酬信息、人才要求 5 大维度
  • 年薪自动计算:月薪 × 薪月数,含奖金月份
  • 细粒度分位值:P10/P25/P30/P40/P50/P60/P70/P75/P80/P90,支持加权计算
  • 多源数据融合:招聘网站 + 行业报告 + 财报 + 论坛,权重可调
  • 17 章节专业报告:从数据概述到调整建议,结构完整
  • 多格式输出:Excel 数据表 + Markdown 报告 + Word 文档

📁 技能结构

skill-salary-market-analysis/
├── SKILL.md                           # 本文件(配置和说明)
├── assets/
│   ├── salary_data_template.csv       # 16 字段基础模板
│   └── salary_data_template_24.csv    # 24 字段增强模板 ⭐
├── references/                        # 参考文档
│   ├── report-template.md             # 17 章节报告模板
│   ├── salary-methodology.md          # 薪酬方法论
│   ├── global-data-sources.md         # 全网数据源指南(20+ 渠道)
│   └── data-collection-guide.md       # 数据收集操作指南
└── scripts/                           # Python 脚本
    ├── multi_source_processor.py      # ⭐ 核心处理脚本(多源整合)
    ├── data_processor.py              # 基础处理器
    ├── data_cleaner.py                # 数据清洗
    ├── csv_to_excel.py                # CSV 转 Excel
    └── markdown_to_word.py            # Markdown 转 Word

🔧 依赖安装

pip install numpy>=1.21.0 pandas>=1.3.0 openpyxl>=3.0.0 python-docx>=0.8.11 beautifulsoup4>=4.11.0
# 可选:Playwright 自动化
pip install playwright>=1.40.0
playwright install chromium

🔄 工作流程

用户需求
  ↓
岗位识别(级别 / 行业 / 地域)
  ↓
数据收集(5 种方案可选)
  ├─ 方案 1: 全网搜索 + 手动收集(最稳定,推荐首选)
  ├─ 方案 2: Tampermonkey 用户脚本
  ├─ 方案 3: Chrome 扩展
  ├─ 方案 4: OCR 截图识别
  └─ 方案 5: Playwright 自动化
  ↓
数据处理
  ├─ 多源整合(multi_source_processor.py)
  ├─ 权重应用
  ├─ 薪酬区间转换(月薪 × 12)
  └─ 分位值计算(P10-P90)
  ↓
报告生成
  ├─ Markdown 报告(参照 report-template.md)
  ├─ Word 格式转换
  └─ Excel 数据输出

📊 24 字段数据模板

#字段说明示例
---------------------
1id唯一标识1
2source数据来源前程无忧 / 猎聘 / 智联招聘 / 脉脉 / 行业报告
3link数据链接https://...
4collect_date收集日期2026-04
5position岗位名称法务总监
6level岗位级别总监 / 经理 / 高级 / 初级
7department所属部门法务部
8responsibility职责描述负责...
9skills技能要求法律职业资格 / 英语流利
10location工作地点深圳光明
11company_name公司名称英威腾电气
12company_size公司规模1000-5000 人
13industry所属行业制造业
14company_type公司类型上市公司 / 民营 / 外商独资
15company_address公司地址深圳市光明区...
16salary_range薪酬区间(原始文本)4-5.5 万·14 薪
17salary_structure薪酬结构基本工资 + 绩效 + 年终奖
18benefits福利待遇五险一金 / 补充医疗 / 年假
19education学历要求本科
20major专业要求法学
21experience经验要求5-10 年
22age年龄要求30-40
23other_requirements其他要求英语六级 / 有海外经验
24post_date发布日期2026-03-15

16 字段模板(快速版)

salary_data_template.csv 适用于快速调研,仅包含核心字段:

id, position, company_name, company_type, salary_range, salary_monthly_low, salary_monthly_high, months, annual_salary_low, annual_salary_high, annual_salary_avg, location, experience, education, source, collect_date

年薪计算规则

  • 月薪 × 薪月数 ÷ 10000 = 年薪(万元)
  • 年薪下限 = 月薪下限 × 薪月数 ÷ 10000
  • 年薪上限 = 月薪上限 × 薪月数 ÷ 10000
  • 年薪平均 = (年薪下限 + 年薪上限) ÷ 2
  • 如标注"X 万/年"则直接取该值

📈 多源数据整合权重

SOURCE_TYPES = {
    '招聘网站': {'weight': 1.0, 'quality': 0.9},      # 前程无忧、猎聘、智联招聘等
    '行业报告': {'weight': 1.2, 'quality': 0.95},      # Mercer、Willis Towers Watson
    '财报':     {'weight': 1.1, 'quality': 0.95},      # 上市公司年报
    '论坛':     {'weight': 0.8, 'quality': 0.7},       # 脉脉、知乎等
    '其他':     {'weight': 0.9, 'quality': 0.75}       # 其他来源
}

📝 参考文档

  1. report-template.md - 17 章节专业报告模板(数据概况、分位值、行业对比、薪酬诊断、调整建议)
  2. salary-methodology.md - 薪酬调研方法论(分位值定义、统计学原理、数据质量评估)
  3. global-data-sources.md - 20+ 数据渠道指南(薪酬分享平台、社交媒体、技术社区、行业报告)
  4. data-collection-guide.md - 数据收集操作指南

💡 使用示例

快速开始

# 1. 复制 24 字段模板
cp assets/salary_data_template_24.csv data.csv

# 2. 收集数据(手动或通过工具)
# ... 填写 data.csv ...

# 3. 数据清洗
python3 scripts/data_cleaner.py -i data.csv -o clean_data.csv

# 4. 生成报告
python3 scripts/multi_source_processor.py -i clean_data.csv -o report.json

# 5. 转 Excel
python3 scripts/csv_to_excel.py -i clean_data.csv -o salary_report.xlsx

完整流程(AI 辅助)

  1. 用户提供岗位需求(岗位名称 + 地域 + 级别)
  2. 使用 web-search-plus 搜索目标岗位薪酬信息
  3. 提取关键数据填写到 24 字段 CSV 模板
  4. 运行清洗和处理脚本
  5. 基于报告模板生成 17 章节 Markdown 报告
  6. 可选转换为 Word 文档

⚠️ 注意事项

  1. 真实数据优先:明确禁止使用模拟数据,强制从真实渠道获取
  2. 数据时效性:优先收集近 6 个月内的数据
  3. 地域差异:不同城市薪酬差异大,需按地域分类分析
  4. 行业对标:选择同行业或相近行业的数据进行比较
  5. 样本量要求:每个岗位至少 10 个有效样本,推荐 20+
  6. 异常值处理:极高薪酬(>200 万/年)需标注可能含股权激励
  7. 薪月数注意:注意区分 12 薪、13 薪、14 薪等不同薪月数

版本历史

共 1 个版本

  • v2.0.0 当前
    2026-05-21 15:31 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

business-ops

Diting

tuobadaidai
谛听 — HR 深度组织诊断系统,基于麦肯锡七步法+苏格拉底审计+冰山模型。支持维度裁剪(/谛听 薪酬/文化/组织/变革 单维度路径)。v9.1 优化架构(31KB→11KB主文件,详情拆分至 references)。v9.0 新增数据安全
★ 2 📥 1,003
data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 297 📥 141,933
data-analysis

Tavily 搜索

jacky1n7
通过 Tavily API 进行网页搜索(Brave 替代方案)。当用户要求搜索网页、查找来源或链接,且 Brave 网页搜索不可用时使用。
★ 274 📥 100,919