俄语视频学习助手
功能概述
从俄语视频(vlog、教程等)中自动提取俄语对话内容,生成结构化的学习笔记,并同步到 Obsidian 知识库。
工作流程
步骤 1:导入视频
支持两种方式:
- 提供视频文件路径(如
@C:/path/to/video.mp4)
- 将视频文件复制到工作区
系统会自动:
- 复制视频到临时路径(避免中文路径问题)
- 提取音频数据
步骤 2:俄语识别
使用 Whisper 语音识别引擎:
- 自动检测俄语内容
- 提取时间轴信息
- 支持过滤纯中文/英文片段
步骤 3:生成学习内容
自动生成包含以下内容的笔记:
- 俄语原句对照表(时间 + 俄语 + 中文)
- 词汇学习表
- 语法点分析
- 实用表达
- 视频背景备注
步骤 4:同步到 Obsidian
将生成的内容追加到 Obsidian 知识库中的 俄语学习.md 文件。
使用方法
在对话中直接使用以下方式触发:
@视频路径 提取俄语字幕
或
帮我处理这个俄语视频 [粘贴视频路径]
技术依赖
- Python: 3.8+
- 核心库: openai-whisper, av, numpy
- OCR 备选: pytesseract(需安装俄语语言包)
- Obsidian MCP: 用于同步笔记
输出文件
transcription_russian.txt - 纯俄语文本
transcription_full.json - 完整结果(含时间轴)
注意事项
- Whisper 需要下载模型,首次运行会自动下载
- 如果视频有内嵌字幕轨道,会优先提取
- OCR 方案作为语音识别的补充(字幕识别更准确)
- 视频建议时长:30秒 - 10分钟效果最佳