← 返回
未分类 Key

Bilibili Auto Transcript

B站视频转录+收藏夹扫描。三级降级(CC→AI→Whisper),AI摘要生成。
B站视频转录+收藏夹扫描,三级降级(CC→AI→Whisper),AI摘要生成。
54lynnn 54lynnn 来源
未分类 clawhub v5.0.1 7 版本 99893.2 Key: 需要
★ 2
Stars
📥 895
下载
💾 1
安装
7
版本
#54lynnn#auto#bilibili#chinese#latest#scanner#subtitles#transcript

概述

📼 Bilibili 视频转录 & 收藏夹自动扫描

双模式技能 — 可以手动转录单个视频,也可以定时扫描收藏夹自动处理。

模式一:手动转录

当你给我一个 B站链接时,我会自动执行转录。

用法:

bash scripts/bilibili_transcript.sh "https://www.bilibili.com/video/BVxxxxx/"

转录优先级(自动降级):

  1. 人工CC字幕(zh-CN, zh-TW, en, ja 等)→ 100%准确,秒出
  2. AI字幕(ai-zh, ai-en, ai-ja 等9种语言)→ 85-90%准确,秒出
  3. OpenAI Whisper 语音转文字(智能选模型)→ 有独显≥6GB 用 medium,<6GB 用 small;无独显用 base/tiny

Whisper 智能模型选择:

条件模型速度参考
:----::----::--------:
有 GPU,显存 ≥6GBmedium高质量,~0.3x 实时
有 GPU,显存 <6GBsmall平衡,~0.5x 实时
无 GPU,视频 ≤30 分钟base质量与速度平衡
无 GPU,视频 >30 分钟tiny避免等待过久
  • 自动检测 CUDA / nvidia-smi 获取显存
  • 音频自动转为 16kHz 单声道 WAV(统一格式)

设计决策:为什么从 Qwen3-ASR 换回 Whisper?

v4.x 引入了 Qwen3-ASR 作为本地转录引擎,v5.0 换回了 Whisper。核心原因:

  1. 架构差异巨大 — Qwen3-ASR 是 LLM 做语音转文字,把音频整段送进大语言模型做推理,1.7B 模型要完整加载 LLM 权重,显存占用大、推理慢。Whisper 是纯语音识别模型,音频切成 30 秒一段做声学特征识别,不需要 LLM 推理,速度快得多
  2. 资源占用 — Qwen3-ASR-1.7B 需要 4-6GB 显存且推理时间长(LLM 的 O(n²) attention),Whisper medium 虽然也要 ~5GB 显存但处理方式轻量,且有更小的模型可选(tiny 仅 ~39MB)
  3. 安装省心pip install openai-whisper 一行搞定,模型首次使用时自动下载。Qwen3-ASR 需从 HuggingFace 下载 2-5GB 权重,国内网络经常失败
  4. 够用即可 — 语音转文字在这个 skill 里是三级降级的最后一环,大多数视频走 CC 或 AI 字幕就完了。为这个兜底场景扛一个 LLM 级别的模型,不值当
  5. Qwen3-ASR 保留可选 — 如果你确实需要更高的中文准确率(LLM 上下文理解加成)、有足够的 GPU 显存,scripts/qwen3_transcribe.py 还在,可手动替换

⚠️ 关键步骤(必须执行): 脚本运行后,AI必须先做这件事,才能向用户报告完成:

  1. 写摘要read 输出的 TXT 文件,阅读全文,用 edit 替换占位符为结构化摘要

转录只负责出文件,索引那是 knowledge-rag 自己的事。


模式二:收藏夹自动扫描

定时检查 B站收藏夹,发现新视频后自动完成「转录 → AI 摘要 → 保存 → 通知」全流程。

工作流

定时触发 → 扫描收藏夹API → 对比已处理列表
  → 发现新视频 → 转录(三级降级)
  → (可选)AI读全文、写结构化摘要
  → 覆盖TXT中的摘要占位符
  → 记录avid到已处理列表
  → 生成转录报告CSV
  → 通知用户(标题/作者/时长/转录来源/摘要/TXT文件)

批量转录(推荐)

.venv/bin/python3 scripts/batch_transcribe.py

自动扫描收藏夹全部视频,逐个转录,支持:

  • 断点续传 — 中断后重跑自动跳过已处理视频
  • 自动重试 — 失败任务自动重试2次
  • 转录报告 — 生成 CSV 报告,含来源分布统计
  • AI摘要 — 可选,设置环境变量 OPENAI_API_KEY 即可自动生成摘要
  • 目录组织 — 按视频发布年月自动分目录存储

首次设置

1. 安装依赖

在技能目录下创建虚拟环境并安装依赖:

cd ~/.openclaw/workspace/skills/bilibili-auto-transcript
python3 -m venv .venv
.venv/bin/pip install openai-whisper requests

2. 创建收藏夹

B站新建一个收藏夹,设为公开

3. 获取收藏夹ID

URL 中 fid= 后面的数字。

4. 修改扫描脚本

编辑 scripts/bilibili_scanner.py,改 FAV_MEDIA_ID 为你的收藏夹ID。

5. Chromium 登录B站(获取Cookie)

chromium-browser &
# 打开 bilibili.com 并登录

6. 检查依赖

yt-dlp --version    # 必需
ffmpeg -version     # 必需
.venv/bin/python3 -c "import whisper; print('Whisper OK')"  # 必需
opencc --version    # 可选,繁转简

7. 配置定时任务(推荐每6小时)

openclaw cron add \
  --name bilibili-scan \
  --every 21600000 \
  --message "运行扫描脚本:cd ~/.openclaw/workspace/skills/bilibili-auto-transcript && .venv/bin/python3 scripts/bilibili_scanner.py"

公共部分

转录脚本

scripts/bilibili_transcript.sh — 两个模式共享同一个引擎(v5.0)。

scripts/qwen3_transcribe.py — (保留)Qwen3-ASR 可选替代,如需使用可手动替换。

依赖

  • yt-dlp — 视频下载、字幕获取
  • ffmpeg — 音频处理
  • openai-whisper — 本地语音转文字引擎(通过 .venv/bin/pip install openai-whisper 安装)
  • requests — HTTP 请求(批量转录用)
  • opencc — 繁转简(可选)
  • chromium-browser — Cookie 支持(B站AI字幕)

输出文件格式

================================================================================
B站视频转录文档
================================================================================

📹 视频标题:xxx
🔗 B站链接:xxx
👤 作者:xxx
📅 发布时间:xxx
⏱️  视频时长:xxx
📝 转录来源:CC字幕 / B站AI字幕 / Whisper medium(GPU加速)
⏰ 转录时间:xxx

================================================================================
第一部分:视频摘要(AI生成)
================================================================================

【AI待处理:请阅读全文后,替换此行,写结构化摘要】
(设置 OPENAI_API_KEY 后自动生成)

================================================================================
第二部分:完整原文
================================================================================

(完整转录内容...)

================================================================================
文档结束
================================================================================

配置参数

参数默认值说明
--------------------
收藏夹ID(需设置)URL fid= 的数字
输出目录~/workspace/knowledge/bilibili/TXT存放路径,自动按年/月分子目录
已处理记录~/.openclaw/workspace/.auto-transcript-state/processed_videos.txt去重文件(每行一个avid)
转录报告~/.openclaw/workspace/.auto-transcript-state/transcript_report.csv每次批量转录的详细报告
扫描间隔每6小时自动模式定时
OPENAI_API_KEY(可选)设置后自动生成AI摘要

B站收藏夹API

GET https://api.bilibili.com/x/v3/fav/resource/list?media_id={ID}&ps=20&pn=1
  • ps 最大20(脚本已设 ps=20)
  • 公开收藏夹无需Cookie

avid vs bvid

  • id = avid(数字)→ 去重追踪用
  • bvid / bv_id = BV号 → 构建转录URL用

注意事项

  1. 同文件覆盖 — 同一BV号多次转录覆盖旧文件,已处理列表防重复
  2. 需要Cookie — 通过 Chromium cookie 获取 AI 字幕,需先B站登录;Cookie快过期时脚本会提示
  3. Whisper 首次运行 — 首次使用时自动下载模型权重(tiny ~39MB / base ~74MB / small ~244MB / medium ~769MB),后续使用无需下载
  4. Whisper 耗时 — GPU模式约实时 0.3x-0.5x 倍速,CPU模式约实时 0.5x-2x 倍速(依模型大小)
  5. 虚拟环境 — 所有 Python 脚本需在 .venv 中运行:.venv/bin/python3 scripts/xxx.pybilibili_transcript.sh 会自动检测并提示安装
  6. B站API ps上限20 — 超过需分页
  7. 摘要占位符必须替换 — 设置 OPENAI_API_KEY 环境变量可自动生成摘要
  8. 只干自己的事 — 转录只输出文件。索引是 knowledge-rag 的事情
  9. 输出目录 — 自 v3.0 起按视频发布年月自动组织目录(如 bilibili/2026/06/

推荐搭配:📖 Knowledge RAG

装了这个 skill 后再装 knowledge-rag,知识库会定时自动扫描新文件并索引,无需手动操作:

clawhub install knowledge-rag

转录后自动索引,随时用自然语言搜索所有转过的内容,还有网页搜索界面。


📦 开源 & 交流

版本历史

共 7 个版本

  • v5.0.1 当前
    2026-06-09 16:47
  • v5.0.0
    2026-06-06 06:24
  • v3.5.1
    2026-06-04 13:02
  • v3.5.0
    2026-06-01 20:49 安全
  • v3.3.9
    2026-06-01 12:31
  • v3.3.2
    2026-05-31 13:46 安全 安全
  • v3.1.0
    2026-05-29 14:05

安全检测

腾讯云安全 (Keen)

队列中

腾讯云安全 (Sanbu)

队列中

🔗 相关推荐

Knowledge Rag

54lynnn
个人知识库:存笔记、搜内容;自然语言搜索本地文档,无需记文件名;对 AI 说‘把这段存到知识库’即自动保存并建索引。推荐搭配 Bilibili Auto Transcript:视频转录自动入库,转完即搜。
★ 1 📥 671
productivity

Bilibili AI Subtitle

54lynnn
下载B站视频AI生成字幕(自动字幕)。适用于快速获取含AI字幕的B站视频字幕。
★ 0 📥 835
content-creation

Bilibili Transcript Redirect

54lynnn
⚠️ 已升级:本技能已被 bilibili-auto-transcript 取代,请执行 clawhub install bilibili-auto-transcript 安装。
★ 3 📥 1,940