分析视频链接的内容,自动完成:下载 → 语音转文字 → 繁简转换 → 内容分析。
所有 yt-dlp 支持的平台,包括:
用户提供视频链接,说"分析这个视频"、"看看这个视频讲什么"、"总结这个视频"等。
视频链接 → yt-dlp 下载视频 → faster-whisper 本地转录 → opencc 繁简转换 → AI 总结
yt-dlp:下载视频
faster-whisper:本地语音转文字(pip install faster-whisper)
opencc-python-reimplemented:繁简转换(pip install opencc-python-reimplemented)
首次运行时 faster-whisper 会从 HuggingFace 下载模型(约 140MB base 模型)。
脚本已内置国内镜像 hf-mirror.com,无需手动配置。
主脚本,完成完整流程:
# 基本用法
python scripts/analyze_video.py <视频URL>
# 指定模型
python scripts/analyze_video.py <视频URL> --model small
# 输出 JSON
python scripts/analyze_video.py <视频URL> --json
# 不显示时间戳
python scripts/analyze_video.py <视频URL> --no-timestamps
| 参数 | 默认值 | 说明 |
|------|--------|------|
| --model | base | Whisper 模型:tiny/base/small/medium/large-v3 |
| --lang | zh | 语言代码 |
| --no-timestamps | - | 不显示时间戳 |
| --json | - | 输出完整 JSON |
| --keep-temp | - | 保留临时视频文件 |
| 模型 | 大小 | 速度 | 精度 | 推荐场景 |
|------|------|------|------|----------|
| tiny | ~75MB | 最快 | 一般 | 快速预览 |
| base | ~140MB | 快 | 较好 | 日常使用 ⭐ |
| small | ~500MB | 中等 | 好 | 需要更高精度 |
| medium | ~1.5GB | 较慢 | 很好 | 专业场景 |
| large-v3 | ~3GB | 最慢 | 最好 | 最高精度需求 |
拿到转录文本后,AI 应生成结构化总结:
| 错误 | 原因 | 解决方案 |
|------|------|----------|
| yt-dlp 失败 | 平台不支持/网络问题 | 尝试其他平台或检查网络 |
| HuggingFace 超时 | 首次下载模型网络不通 | 已内置 hf-mirror.com 镜像 |
| 内存不足 | 模型太大 | 换更小的模型(如 tiny) |
| 转录质量差 | base 模型精度有限 | 换 small 或 medium 模型 |
--keep-temp 可保留视频文件
共 3 个版本