← 返回
未分类

srt2md

将 SRT 字幕文件转换为结构化 Markdown 文档的完整工作流。无需配置任何额外 API key,完全依赖当前 session 内置能力完成全部处理。 适用场景:用户上传或提供 .srt 字幕文件,想要将视频内容转化为可读文档;整理 Bilibili / YouTube 视频字幕;将字幕内容分析后生成知识文...
将 SRT 字幕文件转换为结构化 Markdown 文档的完整工作流。无需配置任何额外 API key,完全依赖当前 session 内置能力完成全部处理。 适用场景:用户上传或提供 .srt 字幕文件,想要将视频内容转化为可读文档;整理 Bilibili / YouTube 视频字幕;将字幕内容分析后生成知识文...
syajask syajask 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 1
Stars
📥 356
下载
💾 0
安装
1
版本
#latest

概述

SRT to Doc

输入 / 输出

  • 输入.srt 字幕文件(支持 UTF-8 / GBK / Big5 等编码)
  • 输出
  • {标题}.md — 结构化分析文档(主交付物)
  • {标题}_subtitles.txt — 带时间轴的字幕原文(辅助交付物)
  • 命名约定:取视频标题,中文保留,空格→下划线,特殊字符删除
  • 例:大明王朝1566_第一集.md + 大明王朝1566_第一集_subtitles.txt

四阶段流程

阶段一:SRT → TXT

python scripts/srt_to_txt.py input.srt {标题}_subtitles.txt

脚本自动检测编码,输出带时间轴的干净 TXT,并打印条数与时长。

TXT 为独立交付物,不进入最终 Markdown


阶段二:内容分析

读取 TXT 后在当前 session 内完成,不调用任何外部 API

  • 识别主题与核心议题,划分内容段落
  • 提取 3-7 个核心观点(附时间戳)
  • 列出关键概念、人物、专有名词
  • 判断内容类型(影响阶段三的搜索方向):
  • 知识/技术类 → 四个搜索方向全用
  • 人文/叙事类(历史剧、访谈、纪录片)→ 跳过"工具/产品"方向,"最新动态"改搜史料/研究/评论

阶段三:搜索补充

详细搜索策略见 references/search_strategy.md

简要规则:

  • 基于阶段二提炼的概念、人物、工具名提炼搜索词
  • 优先调用 multi-search-engine skill(若可用);不可用时用内置 web_search
  • 每个关键词取最相关 2-3 条,记录来源 URL

阶段四:输出 Markdown

读取 assets/doc_template.md,按模板结构填写内容。

必填章节:内容概要、内容结构、核心观点

条件章节(有内容则写,无则省略):关键概念、主要人物、相关动态/延伸阅读


下游联动

文档生成后可直接交给以下 skill 继续处理:

目标调用 skill
-----------------
发布为微信公众号文章wechat-mp-writer(建议用"历史"或"技术/AI"模板)
搜索同类公众号参考文章wechat-article-search

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 09:14 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

knowledge-management

Summarize

paudyyin
智能摘要工具,自动为长文本、文档、网页生成摘要,提取要点与关键词,支持自定义摘要长度。
★ 957 📥 518,638
knowledge-management

Baidu web search

ide-rea
使用百度AI搜索引擎(BDSE)进行网络搜索。适用于获取实时信息、文档资料或研究课题。
★ 245 📥 107,508
knowledge-management

web-tools-guide

user_ec205dbb
MANDATORY before calling web_search, web_fetch, browser, or opencli. Contains required error-handling procedures (web_se
★ 68 📥 160,227