← 返回
未分类

B站文字稿-提取B站视频为文字稿

提取B站(bilibili.com)视频的完整文字稿。当用户需要提取、获取、下载B站视频的文字稿、字幕、转录内容、语音转文字时使用此skill。支持从视频URL提取音频并使用Whisper进行中文语音识别,生成带时间戳的结构化文字稿。触发词包括"提取B站""B站文字稿""bilibili转录""视频转文字"等。
提取B站(bilibili.com)视频的完整文字稿。当用户需要提取、获取、下载B站视频的文字稿、字幕、转录内容、语音转文字时使用此skill。支持从视频URL提取音频并使用Whisper进行中文语音识别,生成带时间戳的结构化文字稿。触发词包括"提取B站""B站文字稿""bilibili转录""视频转文字"等。
Wayne李老师
未分类 community v1.0.0 1 版本 100000 Key: 无需
★ 8
Stars
📥 120
下载
💾 0
安装
1
版本
#latest

概述

Bilibili Transcript - B站视频文字稿提取

Overview

从B站视频URL提取完整语音文字稿。通过 yt-dlp 下载音频,再用 OpenAI Whisper 进行中文语音识别,生成带时间戳的结构化 Markdown 文字稿文件。

Prerequisites

确保以下工具已安装(如未安装则先执行安装):

  1. yt-dlp - B站视频/音频下载工具

```bash

pip3 install yt-dlp

```

  1. openai-whisper - 语音识别模型

```bash

pip3 install openai-whisper

```

Workflow

Step 1: 下载B站视频音频

使用 yt-dlp 下载视频的音频轨(mp3格式):

yt-dlp -f "bestaudio" --extract-audio --audio-format mp3 -o "<output_dir>/bilibili_audio.%(ext)s" "<B站视频URL>"

注意事项:

  • B站高画质格式需大会员Cookie,但音频轨一般可直接下载
  • 如果遇到SSL证书问题,Python中需设置 ssl._create_default_https_context = ssl._create_unverified_context
  • B站URL格式示例:https://www.bilibili.com/video/BV1RiASzXEEy

Step 2: 检查是否有CC字幕(可选优先路径)

部分B站视频提供UP主上传的CC字幕,如果有则可直接提取,无需语音识别:

yt-dlp --list-subs "<B站视频URL>"
  • 如果显示 zh-Hans / zh 等非弹幕字幕,直接下载字幕文件:

```bash

yt-dlp --write-subs --sub-lang zh-Hans --skip-download -o "/bilibili_subtitle" ""

```

  • danmaku 是弹幕(观众评论),不是视频内容稿,不能替代语音转录
  • CC字幕需要登录Cookie才能获取,未登录时可能无法获取

Step 3: 语音识别转录

使用 scripts/transcribe.py 脚本进行转录:

python3 <skill_dir>/scripts/transcribe.py --input <audio_file> --output <output_file> [--model-size <size>]

参数说明:

  • --input: 输入音频文件路径(必需)
  • --output: 输出文字稿文件路径(必需)
  • --model-size: Whisper模型大小,默认 medium(可选:tiny/base/small/medium/large)
  • medium:中文识别效果较好,模型约1.5GB
  • large:效果最佳但速度慢,模型约3GB
  • small:速度快但中文准确度稍低

Whisper模型选择指南:

模型大小中文效果速度适用场景
--------------------------------------
tiny39M最快快速预览
base74M一般很快短视频
small244M较好一般视频
medium1.5G中等推荐(默认)
large3G最佳长视频/专业需求

Step 4: 获取视频元信息

使用 WebFetch 获取视频的标题、UP主、播放量等元信息:

WebFetch url="https://www.bilibili.com/video/<BV号>" prompt="提取视频标题、作者、播放量、发布时间、简介"

Step 5: 整理输出文字稿

将转录结果整理为结构化的文字稿文件(.txt后缀,微信兼容),格式如下:

# {视频标题}

**UP主**: {作者} | **播放量**: {播放量} | **发布时间**: {发布时间}
**视频链接**: {原始URL}

---

## 完整文字稿

[00:00] 转录内容...
[00:15] 转录内容...
...

---

## 要点总结

| 方法/要点 | 核心思路 | 具体操作 |
|-----------|---------|---------|
| ... | ... | ... |

**金句**: 提取的金句内容

输出规范:

  • 文件保存为 .txt 后缀(微信移动端兼容)
  • 按视频内容逻辑分节,添加章节标题
  • 提取核心要点,整理为表格
  • 提取金句/关键结论
  • 时间戳格式:[MM:SS]

Step 6: 清理临时文件

删除下载的音频文件和弹幕xml文件:

rm -f "<output_dir>/bilibili_audio.mp3" "<output_dir>/bilibili_subtitle.danmaku.xml"

Common Issues

SSL证书错误

现象: Whisper下载模型时出现 SSL: CERTIFICATE_VERIFY_FAILED

解决: 脚本中已内置 ssl._create_default_https_context = ssl._create_unverified_context 绕过

B站字幕需登录

现象: Subtitles are only available when logged in

解决: 使用 --cookies-from-browser chrome 参数传入浏览器Cookie,或直接走语音识别路线

高画质无法下载

现象: Format(s) 4K, 1080P... are missing; you have to become a premium member

解决: 音频轨不受此限制,可正常下载;如需视频画面则需Cookie

FP16不支持

现象: FP16 is not supported on CPU; using FP32 instead

解决: 这是警告而非错误,CPU上自动降级为FP32,不影响结果

Resources

scripts/

  • transcribe.py - Whisper语音识别转录脚本,支持参数化模型选择,输出带时间戳的文字稿

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-05-22 16:06 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

UI/UX Pro Max

xobi667
提供 UI/UX 设计智能与实现指导,帮助打造精美界面。适用于 UI 设计、UX 流程、信息架构、视觉风格、设计系统/标记、组件规格、文案/微文案、无障碍及前端 UI(HTML/CSS/JS、React、Next.js、Vue、Svelte
★ 223 📥 48,398
design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 431 📥 117,554
professional

Patseek专利检索

user_0b65fce7
专利检索技能,基于 PatSeek API 实现三种专利检索能力。当用户需要检索专利、查找专利、搜索专利、查询专利详情、进行语义专利检索时使用此 skill。支持:(1) 按公开号/申请号/关键词简单检索;(2) 支持 AND/OR 逻辑组
★ 4 📥 176