← 返回
未分类

sjht-cam-anno

安防摄像头视频 VL 模型微调数据集标注工具。用于从安防摄像头视频中提取关键帧、分析视频内容、生成结构化标注(含环境/人物/行为/风险描述),并输出符合 dataset.jsonl 格式的微调训练数据。Use when 用户需要对安防摄像头视频进行数据标注、生成 VL 模型训练数据集、处理 /root/hair-...
安防摄像头视频 VL 模型微调数据集标注工具。用于从安防摄像头视频中提取关键帧、分析视频内容、生成结构化标注(含环境/人物/行为/风险描述),并输出符合 dataset.jsonl 格式的微调训练数据。Use when 用户需要对安防摄像头视频进行数据标注、生成 VL 模型训练数据集、处理 /root/hair-...
aowind aowind 来源
未分类 clawhub v1.0.0 1 版本 99769.1 Key: 无需
★ 1
Stars
📥 412
下载
💾 0
安装
1
版本
#latest

概述

hair-cam-anno — 安防摄像头视频标注

对安防摄像头拍摄的视频进行帧提取、视觉分析、结构化标注,输出 dataset.jsonl 格式的 VL 模型微调数据集。

工作流程

第1步:提取视频帧

python3 <skill>/scripts/extract_frames.py \
  --data-dir <视频目录> \
  --output-dir <帧输出目录> \
  --fps 0.5 \
  --max-frames 4
  • 从每个视频均匀提取 4 帧(每2秒一帧)
  • 生成 manifest.json 记录每个视频的元信息和帧路径

第2步:逐视频分析标注

对每个视频:

  1. 查看提取的帧:用 read 工具读取帧图片(支持 jpg/png)
  2. 从文件名推断信息:文件名包含关键信息(如 海尔摄像头-1男1女-坐-2 → 品牌=海尔摄像头, 1男1女, 行为=坐)
  3. 生成标注 JSON:根据帧画面内容 + 文件名信息,生成结构化标注

标注 JSON 结构:

{
  "title": "场景标题",
  "subtitle": "场景副标题",
  "description": "详细描述(≥50字,含环境、人物外貌、行为姿态)",
  "labels": ["system_suggest_X", ...],
  "risk": {
    "level": "none|low|medium|high",
    "description": "风险描述"
  },
  "simple_description": "简练描述(≤20汉字)"
}

第3步:汇总生成 dataset.jsonl

  1. 将所有标注结果收集到 annotations.json,格式:
  2. [
      {"video": "文件名.mp4", "annotation": { ...标注JSON... }},
      ...
    ]
    
  1. 运行构建脚本:
  2. python3 <skill>/scripts/build_jsonl.py \
      --annotations annotations.json \
      --video-dir <视频目录> \
      --output dataset.jsonl
    
  1. 脚本会自动验证标注数据并生成 dataset.jsonl

关键参考

  • System prompt 模板: references/system-prompt.md
  • 标签范围: references/labels-reference.md

标签选择规则

  • 根据视频实际内容选择匹配标签
  • 可多选,但不要选不匹配的标签
  • 如果视频中有危险行为(儿童攀爬窗户、摔倒等),risk.level 应为 medium 或 high
  • 文件名中的信息(人数、行为)必须与标注一致

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-02 15:19 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

AdMapix

fly0pants
AdMapix 原始数据层,提供广告创意、应用、排名、下载/收入及市场元数据。返回 AdMapix API 的结构化 JSON;调用方...
★ 296 📥 139,159
data-analysis

Tavily 搜索

jacky1n7
通过 Tavily API 进行网页搜索(Brave 替代方案)。当用户要求搜索网页、查找来源或链接,且 Brave 网页搜索不可用时使用。
★ 272 📥 100,137
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 208 📥 67,309